大きくて繰り返しのテキストファイルがあります。圧縮率がとても良いです。約3MBほど圧縮されます。しかし、解凍するには1.7GBが必要です。重複しているため、ファイルの内容を調べるには出力のほんの一部しか必要ありません。
.dllを使用してファイルの最初の数メガバイトのみを解凍する方法はありますかgzip
?gunzip
答え1
標準出力に解凍し、次のように供給できますhead
。一部だけをキャプチャします。
gunzip -c file.gz | head -c 20M >file.part
フラグはGNU coreutilsが提供する実装を必要とします-c
。head
head
dd
可能:
gunzip -c file.gz | dd of=file.part bs=1M count=20
両方のパイプラインは、圧縮されていないファイルの最初の20MiBをfile.part
。