ここでは、コマンドを使用して、find
以下のようにいくつかのファイルを一覧表示します。
find /dir1/ -type f -exec md5sum {} + | sort -k 2 > dir1.txt
それから:
find /dir2/ -type f -exec md5sum {} + | sort -k 2 > dir2.txt
ファイルは異なりますが、一部のハッシュは同じです。たとえば、イメージファイルはサウンドファイルxxxxxxxx.jpg
とyyyyyyyy.mp3
同じハッシュを持ちます。
主な質問は、ファイル比較の信頼レベルは何ですかmd5sum
?
答え1
md5sumの衝突確率は2 64の1です。引用するこの投稿詳細については、crypto.seを参照してください。
注:ファイルの内容はハッシュされ、ファイル名はハッシュで何の役割も果たしません。名前だけでなくファイルも違うのは確実ですか?
$ md5 /tmp/files.txt*
MD5 (/tmp/files.txt) = 29fbedcb8a908b34ebfa7e48394999d2
MD5 (/tmp/files.txt.clone) = 29fbedcb8a908b34ebfa7e48394999d2