大容量(〜60G)圧縮ファイル(tar.gz
)があります。
一度はsplit
4つに分けてcat
再び合わせました。
ところで、圧縮されていないファイルのサイズを見積もってみると、元のファイルよりも小さいものになりますか?どうやってこれができますか?
$ gzip -l myfile.tar.gz
compressed uncompressed ratio uncompressed_name
60680003101 3985780736 -1422.4% myfile.tar
答え1
これは、gzip 圧縮ファイルに圧縮されていないサイズを格納するために使用されるフィールドのサイズが原因で発生します。これは32ビットにすぎず、gzip
最大4GiBのファイルサイズしか保存できません。大きい方は正しく圧縮および解凍されますが、gzip -l
1.11以前では圧縮されていないサイズが正しくありません。
したがって、タールボールを分割して再構築してもこの問題は発生せず、ファイルに影響を与えないでください。確実に確認するには使用できますgzip -tv
。
バラより大容量GZIPPEDファイルの圧縮されていないサイズを計算する最速の方法詳しくはこちらをご覧くださいgzip
手動:
形式は
gzip
入力サイズ係数を表します。2キュービックしたがって、4GiB以上の圧縮されていないファイルの圧縮されていないサイズと圧縮率が誤って一覧表示されます。