<p dir="ltr">+1 :-(</p>
<p dir="ltr">I&#39;m doing &quot;THE PURGE&quot;. Very little code is being kept. I grep for my name as I only added that for decently sized projects. The rest are the zillions of one-offs that are easier to redo than find.</p>

<p dir="ltr">Then the fun begins. I added a text blurb to a file with the name, path and description of each code set I&#39;m keeping.  The only code I&#39;m keeping not written by me is specialty stuff that I use or it took eons to find or (this is where it gets ugly) I can no longer find a source for. I treat all of this the same as my stuff.<br>

Once located, I add those paths to by backup process. I then delete on disk duplicates.</p>
<p dir="ltr">Wish I had done this a decade ago </p>
<div class="gmail_quote">On Aug 6, 2014 9:11 AM, &quot;Chris Fowler&quot; &lt;<a href="mailto:cfowler@outpostsentinel.com">cfowler@outpostsentinel.com</a>&gt; wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
This is not the first time I&#39;ve attempted backing up everything I&#39;ve created over 20 years.<br>
<br>
Every so often someone I do not know emails me for a file, software, etc that I may have based on what they read on a mailing list archive.  Last night someone requested a file from a project I was working on back in 2002.<br>

<br>
Looking for this file I am reminded about how much crap I really have.  I have floppies, CDs, DVDs, etc of backups, data, and whatever.  Many of these have dupes.  I want to copy all this stuff to a hard drive then archive it.  I need to deal with these duplicates.<br>

<br>
A year ago I wrote a perl program to locate the duplicates using md5 hashes.  I was then going to delete all, but one of the dupes.  The problem I ran into is that some of these could be installs of software and I needed to keep the dupe.  I was then wasting time manually determining which ones to delete and which ones to keep.<br>

<br>
Last night I had an idea that may work.  Create a directory of the root of the backup named &#39;dupes&#39;.  Copy the dupe once into that directory.  Every where else replace the dupe with a symbolic link.<br>
<br>
My biggest issue with backups is management of the data.  At 40 I&#39;ll copy something today and 6 months from now forget why I even did that.  It could be a 1GB SVN software tree I checked out, made some changes for testing and then decided not to delete it.  Now I have 1GB of stuff I feel like I can not delete.  I can&#39;t even remember why I made the copy.  Ugh.<br>

<br>
I have so many CDs and DVDs stacked in my office it would be nice to get rid of them.  I have drives in boxes that I&#39;ve forgotten what is on them.  I&#39;m a tech hoarder.<br>
<br>
Chris<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://mail.ale.org/pipermail/ale/attachments/20140806/217fedc5/attachment.html" target="_blank">http://mail.ale.org/<u></u>pipermail/ale/attachments/<u></u>20140806/217fedc5/attachment.<u></u>html</a>&gt;<br>

______________________________<u></u>_________________<br>
Ale mailing list<br>
<a href="mailto:Ale@ale.org" target="_blank">Ale@ale.org</a><br>
<a href="http://mail.ale.org/mailman/listinfo/ale" target="_blank">http://mail.ale.org/mailman/<u></u>listinfo/ale</a><br>
See JOBS, ANNOUNCE and SCHOOLS lists at<br>
<a href="http://mail.ale.org/mailman/listinfo" target="_blank">http://mail.ale.org/mailman/<u></u>listinfo</a><br>
</blockquote></div>