圧縮されていないファイル推定エラー?

圧縮されていないファイル推定エラー?

大容量(〜60G)圧縮ファイル(tar.gz)があります。

一度はsplit4つに分けてcat再び合わせました。

ところで、圧縮されていないファイルのサイズを見積もってみると、元のファイルよりも小さいものになりますか?どうやってこれができますか?

$ gzip -l myfile.tar.gz 
         compressed        uncompressed  ratio uncompressed_name
        60680003101          3985780736 -1422.4% myfile.tar

答え1

これは、gzip 圧縮ファイルに圧縮されていないサイズを格納するために使用されるフィールドのサイズが原因で発生します。これは32ビットにすぎず、gzip最大4GiBのファイルサイズしか保存できません。大きい方は正しく圧縮および解凍されますが、gzip -l1.11以前では圧縮されていないサイズが正しくありません。

したがって、タールボールを分割して再構築してもこの問題は発生せず、ファイルに影響を与えないでください。確実に確認するには使用できますgzip -tv

バラより大容量GZIPPEDファイルの圧縮されていないサイズを計算する最速の方法詳しくはこちらをご覧くださいgzip手動:

形式はgzip入力サイズ係数を表します。2キュービックしたがって、4GiB以上の圧縮されていないファイルの圧縮されていないサイズと圧縮率が誤って一覧表示されます。

関連情報