奇妙な圧縮の問題

奇妙な圧縮の問題

必要ですが、Centosサーバーから削除したくない古い履歴のいくつかの生のセンサーデータを圧縮しようとしています。

録音されたデータは独自の形式ですが、すべての意図と目的のために、1000 Hzで306チャンネルPCM 32ビットオーディオ録音として説明できます。ファイルヘッダーには、数百行のプレーンテキストメタデータがあります。ファイルサイズは100 MB〜1.9 GB、ディレクトリサイズは約7 GBです。処理されたファイルディレクトリは、データにフィルタが適用された元のデータのコピーを含む最大60 GBまで可能です。

これは奇妙な点です。 bzip2を使用すると、元のサイズの30%、pxzを使用すると、元のサイズの26%に元のデータを圧縮できます。 ZPAQとlzripを使用して同様の結果を得ました。ただし、データPCM 32ビット変数を処理すると、10%から12%までを減らすことができます。 16ビットの短い処理データで、元のサイズの約50%まで圧縮できます。データを処理すると、データの記録が簡素化され、履歴の変更が減ります。

どんな提案がありますか?似た人はいますか?処理中のデータに対してできるだけスペース効率が良いことを望み、処理後にデータにエラーがないことを確認する予定です。処理された縮小データが元のデータよりも圧縮性が低いのはなぜですか?

//EDIT - FLACを表示しますが、元の形式に戻すと問題が発生する可能性があります。不可能ではありません..まだ探しています。

//ソリューションの編集。 FLACは370チャンネルのデータが好きではありません。しかし、私は自分の大きな辞書を作り、大きなファイルの部分を使って訓練することである程度圧縮することができました。

答え1

フォーマットに関する文書はありますか?生形式をPCM wav +メタデータ+ 3Dデータに変換して再変換する小さなプログラムを作成します。異なる周波数信号がネストされている場合は、FLACなどのロスレスオーディオ圧縮アルゴリズムを使用して十分に圧縮する必要があります。

FLACはMP3と同じです。オーディオデータを別の形式に書き換えて圧縮します。したがって、これは私が「ラッパー」と呼ぶものではありません(私はどのコンプレッサーも「ラッパー」と呼びません)。しかし、MP3とは異なり、圧縮はロスレスです。解凍すると、bzip2などとまったく同じデータが得られます。 FLACのオーディオデータ圧縮率は約50%です。

コンテナ形式に基づいて圧縮オーディオにメタデータを保存する方法はいくつかあります。 3つのファイルをすべて1つのアーカイブファイル(必要な形式で)に入れることもできますが、圧縮PCMデータは圧縮されなくなりました。

関連情報