飛行中の減圧

2024-5-23 • tag-icon

44TBのgzipファイルがあり、各ファイルサイズは圧縮時に1.5GB、圧縮されていない場合はそれぞれ2.0GBです。圧縮されていないファイルのみを読み取ることができるツールがあります。ファイルの小さな部分にのみアクセスすればよいので、ファイル全体を解凍し、結果をディスクに書き込むオーバーヘッドを避けたいと思います。このツールはgzipで圧縮されたデータをすぐに読み取ることはできません。

アプリケーションの観点から見ると、ファイルのすべての機能がありますが、データをディスクに保存するのではなく、メモリ内の即時（おそらくキャッシュ）データを計算する（読み取り専用）ファイルタイプオブジェクトを生成する方法はありますか？）？名前付きパイプを試してみることはできますが、照会は許可されません。 tmpfsで解凍するのはディスクに解凍するよりもわずかに高速ですが（10〜20％）、まだファイル全体を解凍する必要があります。書き込み権限は必要ありません。

マシンには2TBのRAMがあり、Red Hat Enterprise Linux Serverバージョン6.7で動作します。データはpanfsファイルシステムにあります。他のファイルシステムは、小さな（20GB）tmpfsといくつかの一時スペース（15TBが他のファイルシステムと共有）です。私にはシステム管理者権限がありません。

関連情報