同じ md5 合計を持つ出力ライン

Question 1

重複ファイルの検索がジョブの場合は、次のものを使用することもできますfdupes。

特定のパスで重複ファイルを検索します。これらのファイルは、ファイルサイズをMD5署名と比較し、バイト単位で比較することによって検索されます。

fdupes -r .

Answer

重複ファイルの検索がジョブの場合は、次のものを使用することもできますfdupes。

特定のパスで重複ファイルを検索します。これらのファイルは、ファイルサイズをMD5署名と比較し、バイト単位で比較することによって検索されます。

fdupes -r .

Question 2

GNUがある場合は、uniq最初の32文字を繰り返すすべての行を表示するように要求できます。

find path -type f -exec md5sum {} + | sort | uniq -D -w32

uniq連続した重複項目のみが見つかるため、リストを並べ替える必要があります。これはまた、すべてのファイルパスに改行文字が含まれていないと仮定し、すべてのツールがGNU実装であると仮定し、以下を使用します。

find . -type f -exec md5sum -z {} + | sort -z | uniq -z -D -w32 | tr '\0' '\n'

（GNUmd5sumはファイル名の特殊文字を処理する独自の方法ただし、これはuniq上記の方法で使用できない出力を生成します。 )

^{1 技術的には、現在のGNUバージョンでは、uniq最初の32バイトたとえば、UTF-8エンコーディングáと文字は、エンコーディングが0xc3バイトで始まるため、é同じと見なされます。uniq -w1ただし、16進数でエンコードされたMD5とMD5の0-9a-f文字には違いはありません。これらの文字は常にシングルバイトでエンコードされるためです。}

Answer

GNUがある場合は、uniq最初の32文字を繰り返すすべての行を表示するように要求できます。

find path -type f -exec md5sum {} + | sort | uniq -D -w32

uniq連続した重複項目のみが見つかるため、リストを並べ替える必要があります。これはまた、すべてのファイルパスに改行文字が含まれていないと仮定し、すべてのツールがGNU実装であると仮定し、以下を使用します。

find . -type f -exec md5sum -z {} + | sort -z | uniq -z -D -w32 | tr '\0' '\n'

（GNUmd5sumはファイル名の特殊文字を処理する独自の方法ただし、これはuniq上記の方法で使用できない出力を生成します。 )

^{1 技術的には、現在のGNUバージョンでは、uniq最初の32バイトたとえば、UTF-8エンコーディングáと文字は、エンコーディングが0xc3バイトで始まるため、é同じと見なされます。uniq -w1ただし、16進数でエンコードされたMD5とMD5の0-9a-f文字には違いはありません。これらの文字は常にシングルバイトでエンコードされるためです。}

同じ md5 合計を持つ出力ライン

答え1

答え2

関連情報