PDF、DJVU、画像用の最高圧縮率コンプレッサーは何ですか

Question

7zとlzmaは同じ圧縮アルゴリズムですが、コンテナは異なります。 7z安定したアーカイブモードを有効にすると同じことができtar.7z、個々のファイルへのランダムアクセスを提供することも悪くありません。（それでもまだ迷惑ですが。）

pdfは内部的にgzipを使用しているため、圧縮率が低くなります。ほとんどの画像フォーマットは同じです（エントロピーエンコーダの選択はさまざまですが、IIRC JPEGのエントロピーエンコーダはより簡単です）。

理論的には、このアイデアの実装について知りません。単純なgzipやpdf、png、jpeg、その他のさまざまな圧縮ファイル形式のその他のエントロピーエンコーディングを元に戻すアーカイバを持つことができます。その後、LZMAのような良いものとしてそのストリームを圧縮します。抽出時にLZMAストリームからデータを抽出し、必要な部分に対して内部的にPDFを再圧縮できます。出力はpdf/jpg/何でも同じですが、ファイルのチェックサム/ハッシュが異なる場合があります。（したがって、最終レンダリングされたピクセル側ではロスはありませんが、ファイルバイト側では損失はありません。）

PNGとjpegオプティマイザは、個々のファイルに対してこのアイデアをある程度実装します。内部圧縮は、デフォルトではなくgzip -9と同等の機能を使用して再実行されます。

最良の方法は、さまざまなコンプレッサーを使用して約1GBのサンプルを圧縮し、どちらが最も適切かを確認することです。 1GBはコンピュータに適したサイズなので、代表的に使用する必要があります。辞書サイズ。

Answer 1

7zとlzmaは同じ圧縮アルゴリズムですが、コンテナは異なります。 7z安定したアーカイブモードを有効にすると同じことができtar.7z、個々のファイルへのランダムアクセスを提供することも悪くありません。（それでもまだ迷惑ですが。）

pdfは内部的にgzipを使用しているため、圧縮率が低くなります。ほとんどの画像フォーマットは同じです（エントロピーエンコーダの選択はさまざまですが、IIRC JPEGのエントロピーエンコーダはより簡単です）。

理論的には、このアイデアの実装について知りません。単純なgzipやpdf、png、jpeg、その他のさまざまな圧縮ファイル形式のその他のエントロピーエンコーディングを元に戻すアーカイバを持つことができます。その後、LZMAのような良いものとしてそのストリームを圧縮します。抽出時にLZMAストリームからデータを抽出し、必要な部分に対して内部的にPDFを再圧縮できます。出力はpdf/jpg/何でも同じですが、ファイルのチェックサム/ハッシュが異なる場合があります。（したがって、最終レンダリングされたピクセル側ではロスはありませんが、ファイルバイト側では損失はありません。）

PNGとjpegオプティマイザは、個々のファイルに対してこのアイデアをある程度実装します。内部圧縮は、デフォルトではなくgzip -9と同等の機能を使用して再実行されます。

最良の方法は、さまざまなコンプレッサーを使用して約1GBのサンプルを圧縮し、どちらが最も適切かを確認することです。 1GBはコンピュータに適したサイズなので、代表的に使用する必要があります。辞書サイズ。

PDF、DJVU、画像用の最高圧縮率コンプレッサーは何ですか

答え1

関連情報