2008-01-11

Neues von MD5

Ich habe vor kurzem einen Eintrag über MD5 geschrieben und in diesem Zusammenhang ein Programm vorgestellt, das auf Basis der Standard-Klasse MessageDigest Prüfsummen von Dateien ermittelt. Dass sich solche Message Digests gut eignen, um nach Dubletten zu suchen, wissen Sie bereits. Wie Sie meine Klasse TKJMD5 hierzu einsetzen können, zeige ich Ihnen im Folgenden. Werfen Sie bitte einen Blick auf das Listing TKDupeFinder.java.
Die Idee des Programms ist, einer MD5-Checksumme eine Liste von Dateien zuzuordnen. Jedes Element dieser Liste hat also dieselbe Prüfsumme. Die Klasse nimmt die Prüfsumme als Schlüssel einer Hashtable. Der Wert dieser Hashtable ist ein Vector, dessen Elemente wiederum File-Objekte sind. Ein Aufruf der Methode scanDir() startet die Suche nach Dubletten.