この質問は少し「フィードバックベース」かもしれませんが、圧縮レベルの使用に関する権威ある情報源を見つけることでこれを検討してください。
さまざまなサイズ(メガバイトから40 GBまで)の複数のデータベースを持つサーバーがあります。現在、gzip -9
圧縮レベルを使用しており、バックアップが非常に遅いです。
私たちは毎日のバックアップポリシーを持っており、以下を維持します。
- 14日間毎日バックアップ
- 2ヶ月間毎週バックアップ
- 2年間月間バックアップ
- 年間永久バックアップ
データベースのバックアップは次のように実行されます。mysqldump ... > | gzip -9 -c > $TIMESTAMP.sql.gz
小規模データベースに対してさまざまな圧縮レベルを試しました。結果は次のとおりです。 (サーバーの負荷が多少重すぎるため、多少不正確な場合があります。)
level | time (real) | output file size
1 | 0m1.844s | 6.6M
3 | 0m1.902s | 6.1M
5 | 0m2.112s | 5.1M
7 | 0m2.447s | 4.9M
9 | 0m3.498s | 4.8M
その後、5または7の圧縮レベルを使用する必要があり、9の圧縮レベルは避けるべきだと思います。
問題は次のとおりです。
バックアップ圧縮レベルに関する一般的な慣行は何ですか?
会社や機関ではどの規格を使用していますか?
答え1
バックアップ圧縮レベルに関する一般的な慣行は何ですか?
いいえ、すべては厳密にあなたのニーズと能力に依存します。
会社や機関ではどの規格を使用していますか?
いいえ、自分に合ったものを使用してください。
gzipの代わりにZSTDを使用することをお勧めします。十分に成熟し、圧縮率がgzipよりはるかに優れており、解凍速度も驚くほど速いです。--long
1 と 2 を含む 22 の圧縮レベルがあるため、どれ--ultra
が最適なのかを調べるために実験を行う必要があります。
圧縮データにPAR2を使用し、元のデータと圧縮データのチェックサムを維持することを検討してください。チェックサムがないと、データを保存または検索するときにビットエラーが発生してデータが失われる可能性があります。