gzipが同じサイズのファイルを生成しないのはなぜですか？

Question

分割ファイルには、元の（フル）ファイルのさまざまな部分が含まれており、内容が異なる場合があります。（同じ唯一の方法は、オリジナルが非常に反復的であるということです。）

コンテンツが異なる場合、圧縮結果も異なります。このようなaaaaaaaaaaものはwekfsiorlm。 123MBでは、ここにある例ほど極端ではないとしても、あるファイルが他のファイルよりも「ランダム」（圧縮しにくい）に見えるスペースがかなり多いです。

圧縮結果ファイルのサイズを制御するには、元のファイルをより小さな部分に分割して個別に圧縮し、目的のサイズ制限に達するまで圧縮された部分を一緒にリンクします。（しかし、これを行う簡単な方法は思いません。）

入力に複数gzip -dのgzip圧縮ファイルが含まれている場合は、すべて解凍されます。ただし、分割するとデータが人為的に中断されるため、圧縮パフォーマンスが一部失われます。

Answer 1

分割ファイルには、元の（フル）ファイルのさまざまな部分が含まれており、内容が異なる場合があります。（同じ唯一の方法は、オリジナルが非常に反復的であるということです。）

コンテンツが異なる場合、圧縮結果も異なります。このようなaaaaaaaaaaものはwekfsiorlm。 123MBでは、ここにある例ほど極端ではないとしても、あるファイルが他のファイルよりも「ランダム」（圧縮しにくい）に見えるスペースがかなり多いです。

圧縮結果ファイルのサイズを制御するには、元のファイルをより小さな部分に分割して個別に圧縮し、目的のサイズ制限に達するまで圧縮された部分を一緒にリンクします。（しかし、これを行う簡単な方法は思いません。）

入力に複数gzip -dのgzip圧縮ファイルが含まれている場合は、すべて解凍されます。ただし、分割するとデータが人為的に中断されるため、圧縮パフォーマンスが一部失われます。

関連情報