内容に基づいてすべてのファイルを一覧表示する Bash コマンド

Question 1

$ cksum file* | awk '{ ck[$1$2] = ck[$1$2] ? ck[$1$2] ", " $3 : $3 } END { for (i in ck) print ck[i] }'
file3, file5
file1, file2, file4

*.txtあなたの場合は、代わりにまたはeven *（比較したいディレクトリにファイルのみがある場合）を使用してくださいfile*。

結果は、file3andがandfile5と同じ内容を持っていることを示しています（この場合）。file1file2file4

標準cksumユーティリティは、各ファイルに対して3つの列を出力します。 1つ目はチェックサム、2つ目はファイルサイズ、3つ目はファイル名です。

コードawkはチェックサムとサイズを配列のキーとして使用ckし、そのキーのコンマ区切り文字列に同じキーを持つファイル名を格納します。最後に、ファイル名（カンマ区切り文字列）を印刷します。

面白い

ck[$1$2] = ck[$1$2] ? ck[$1$2] ", " $3 : $3

ck[$1$2]「何でも設定すると割り当てck[$1$2] ", " $3（ck[$1$2]ファイル名の間にカンマを追加）、それ以外の場合は割り当て$3（このキーを持つ最初のファイル名）」を意味します。

各リストの項目数に基づいて出力をソートするには、出力を次に渡します。

awk -F, '{ print NF, $0 }' | sort -n | cut -d ' ' -f 2-

...後処理段階です。ファイル名にカンマが含まれていると、明らかに壊れてしまいます。

または使用

cksum file* | awk '{ n[$1$2]++; ck[$1$2] = ck[$1$2] ? ck[$1$2] ", " $3 : $3 } END { for (i in ck) print n[i], ck[i] }' | sort -n | cut -d ' ' -f 2-

ファイル名にカンマがある場合は問題ありません。

cut各出力行のファイル名の数を表示するには、このオプションを無視してください。

多数のファイルに使用できます。

find . -type f -exec cksum {} +

そして同様に

cksum *

Answer

修正された部分です昨日書いた答え:

$ cksum file* | awk '{ ck[$1$2] = ck[$1$2] ? ck[$1$2] ", " $3 : $3 } END { for (i in ck) print ck[i] }'
file3, file5
file1, file2, file4