dublettenfinder.sh
Geschrieben von Mathias am Sonntag, 25. März 2007 um 01:48
und abgelegt in der Kategorie Frickeleien, Geekstuff, Linux/Unix, Mac
Irgendwie muss ich gerade in einer produktiven Phase stecken. Soeben habe ich den “dublettenfinder” fertiggestellt, ein kleines Shellscript (präzise: Bash-Script), das die md5-Prüfsummen aller Dateien eines gegebenen Verzeichnisses berechnet, diese vergleicht, und so doppelt vorhandene Dateien findet.
Sicher ist das Script grade bei großen Dateien ziemlich langsam, es verrichtet aber zuverlässig seinen Dienst. Dinge, die ich noch ändern möchte, sind:
- Die Performance (ließe sich evtl. mit einer Art Vorauswahl lösen, bei der nur die md5-Hashes von Dateien gebildet werden, die auch die gleiche Größe haben)
- Anpassen für Linux und andere Unixe
Hier steht es übrigens zum Download bereit.