rdfind
現在4TBを超えるファイルを含むディレクトリで実行されています。チェックサム部分は時間がかかるので、代替を探しています。サイズによる衝突はないと確信していますfind /mnt/local/ -type f -printf "%s\t%p\n" | sort --numeric
。最初の数キロバイトのサイズやハッシュに基づいて重複ファイルをハードリンクするためのツールやスクリプトはありますか?
答え1
jdupes
各ファイルの最初のデータブロックのみをチェックサムするオプションを使用して設定できます-T
。
jdupes -T -T -r -L /mnt/local
/mnt/local
以下に見つかったすべての重複項目は、サイズと最初のブロックのハッシュのみに基づいてハードリンクされます。