dublettenfinder.sh

Irgendwie muss ich gerade in einer produktiven Phase stecken. Soeben habe ich den “dublettenfinder” fertiggestellt, ein kleines Shellscript (präzise: Bash-Script), das die md5-Prüfsummen aller Dateien eines gegebenen Verzeichnisses berechnet, diese vergleicht, und so doppelt vorhandene Dateien findet.

Sicher ist das Script grade bei großen Dateien ziemlich langsam, es verrichtet aber zuverlässig seinen Dienst. Dinge, die ich noch ändern möchte, sind:

  • Die Performance (ließe sich evtl. mit einer Art Vorauswahl lösen, bei der nur die md5-Hashes von Dateien gebildet werden, die auch die gleiche Größe haben)
  • Anpassen für Linux und andere Unixe

Hier steht es übrigens zum Download bereit.

Einen Kommentar hinterlassen...

Hinweis: Die Felder "Name" und "Email" müssen ausgefüllt werden, die Emailadresse wird jedoch nicht angezeigt.