背景:
私はLTO-8テープを使用しており、時間の経過とともにテープのデータが破損する可能性があるという懸念があります。私が達成したいのは、par2を使用して復元/修復/修復を試すことができるものを作成することです。そのLTO-8テープの将来は、破損する可能性があるすべてのデータです。
私の思考プロセス/アプローチは次のとおりです。
私はRAID5 / raidzが1つのドライブを使用してパリティデータを保存する方法について考えています(既存のRAID 5パリティではRAIDアレイから削除されると思います)。
par2には、パリティレベルおよび/または生成するパリティ数を設定できるコマンドフラグ「-r」があります。
わかりました。
しかし、私が理解していないのは、ファイル内の対応するフラグを使用すると.par2ファイルが生成されることです。これは"RAID5"/"raidz"と同じですか、それとも同様のことを達成しようとする私の全体的な思考プロセスとアプローチです効果は完全に間違っていますか?
LTO-8テープ自体がいくつかのチェックサムを実行していることを知っていますが、チェックサムに問題がある場合はそれ自体がどのように解決されるかはわかりません(該当する機能がある場合 - LTFSについては読みませんでした)。まだ)記事で可能であるという文書を見たことがないが、不可能であるという文書も読んだり見たりしていない。
自分で回復できない場合(または最悪のシナリオだと思います)、par2を使用するとデータ破損からテープを保護するのに十分ですか?
また、現在設定されている方法は、.par2ファイルも同じテープに書き込まれることです。その後、テープバックアップ自体に重複コピーなどの親サブ構造があります。
パリティデータを使用できる場合は、上位/下位/冗長バックアップ構造を使用する代わりに、テープの半分を空にして他のデータに使用します。
これを達成する方法についてのすべての考え、アイデア、および/または洞察力は高く評価されます。
ありがとうございます。
答え1
par2
動作原理
par2
特定のデータファイルセットのパリティ比を計算することを選択できます。内部的に、データセット全体を次のように分割します。彫刻このブロックのパリティ情報を計算します。だからデフォルトの作業単位はブロックです。(整合性検査およびデータ再構成用)
このアルゴリズムは実際にはいくつかのRAIDアルゴリズムと似ていますが、すべてのパリティブロックを使用して破損したデータブロックを回復できるため、従来のRAID 5よりも複雑です。それを使うリードソロモンエラー訂正コードより多くの計算が必要です!
2つの異なるブロックの場合非常に少し破損してもデータを回復するには、2つのパリティブロックが必要です。一方、1ブロックの場合完全破損後に回復するには、パリティブロックが1つだけ必要です。したがって、それに応じてブロックサイズを考慮することもできます。
また、par2
部分的に読み取り可能な破損したファイルの一部のパリティ情報を読み続けることができる場合は、データ復旧に依然として機能する可能性があります。
それから(壊れた)と一緒に使用するように設計されています。文書(データフローではなく)。
はい
したがって、以下を選択できます。
FULL DATASET + 20% par2 parity files
これは薬を失う可能性があることを意味します。あなたのデータの20%に相当します。彫刻。
決定を下す際に考慮すべき事項
それからあなたの選択はあなた次第です。
- データセット全体のサイズ(大きいほど、リカバリおよびパリティ構成にはより多くのコンピューティングリソースが必要です)
- 計算したいパリティ比、
- データのパリティと物理的な場所
- ブロックサイズ、
知っている:
- リカバリを実行するには、完全な(破損した)データセット+ par2_dataが必要です。このリカバリはディスク上で実行する必要があります。
- これを修正するには、無視できないほどのCPUパフォーマンスが必要です。
- テープリーダー/ライターとソフトウェアには、回復に役立つ可能性がある場合とそうでない可能性がある、読み取れないデータに対する特定の動作がある場合があります。
いくつかの可能性
テープリーダーが読み取れないバイトを0に等しいバイトに置き換えることができる場合は、par2
ファイルを同じテープに保存するのが妥当であると思います。これにより、完全な破損シナリオを試すよりも回復プロセスが容易になります。ファイルは次のようになります。ディスクに転送すると失われます。
テープ全体が失われるリスクを考慮している場合は、実際には複数のテープデータセットに対して計算されたパリティファイルが必要であり、少なくとも最大のテープが格納できるだけのパリティデータが必要です。回復するには、残りのテープデータとパリティデータをディスクに転送して、失われたテープデータを再構成する必要があります。
結論として
par2
非常に柔軟性があるため、すべてはあなたとあなたが避けたいデータ損失のシナリオによって異なります。
par2
クラシックRAIDパリティのようには機能しませんし、この目的のために作られていません。あるディスクの特定のデータブロックが別のディスクの特定の専用パリティブロックを持ち、すべてのパリティブロックがより複雑で高価なプロセスを介してpar2
別のブロックによって回復できるため、RAIDパリティの回復が高速になります。
したがって、修理期間を考慮することもできます。 「ラージ」データセットでpar2を使用して破損したデータを回復するのに時間がかかることがあります。決定を下す前に、いくつかのテストを試すことをお勧めします。
par2
冗長性とデータ損失を防ぐために引き続き使用できますが、上記の要因を考慮してください。