同様のファイルの最高の圧縮は何ですか?

同様のファイルの最高の圧縮は何ですか?

バイナリデータベースダンプなどの完全な古いバックアップがあります。明らかに大きな違いはないので、フルバックアップを実行するのが最も賢明なアイデアではありません。現在、私はほとんどのファイルが同様の内容を持っているという事実を活用できる圧縮プログラムを探しています。

答え1

ファイルを最初に圧縮すると、tar cvf my_backup.tar <file list...>どんな圧縮ツールもうまく動作します(次を使用して)。

したがって、ファイルをtarし、zip、7-zip、bzip2などに入れます。 tarファイルでさまざまな圧縮アルゴリズムを試して、どちらが最もうまく機能するかを確認できます。

答え2

私は7-Zipを使って幸運になりました。魔力が足りると、とても大きな窓でも走ることができます。類似点を見つけるためにソースファイルをできるだけ圧縮しないようにしてください。 (例えば、異機種環境のExcelファイルの場合、xlsxファイルは保存時に少し圧縮されるため、最初に内容を解凍したという意味です。かつて、ほぼ重複した600MiB+のExcelバージョンファイルを数百KiBに圧縮できました。)

関連情報