ビットの破損(または検証)を防ぐ簡単なバックアップソリューション

ビットの破損(または検証)を防ぐ簡単なバックアップソリューション

私は、さまざまなドライブに保存されているデータのランダムビット反転(いわゆるビット破損)を防ぐための簡単なソリューションを探しています。それらはディスクではありませんソート、週に一度バックアップする単一のディスクです。だから私は探していません冗長性、そうでなければファイルの整合性- つまり、長い間接続されていないファイルがランダムに破損したかどうかを知りたい、可能であれば修正したい。

私は一般的な解決策が欲しいことに注意してください。いいえ私はZFSやbtrfs(私はすでに知っています)などのファイルシステムを探しています。部分的には、チェックサムのオーバーヘッドが大きすぎて複雑すぎたり不安定になるためです(btrfsの場合)。

必ずしもそうする必要はありません。自動もの。つまり、新しく作成されたファイルのチェックサムを作成および復元するためにコマンドを実行する必要がある場合は問題ありませんが、手動でチェックサムを保存し、間違ったファイルを確認して変換するよりも使いやすくなります。再インポートなど(すでにこれを行っているので、よりシンプルで手作業の少ないものを要求しました)。

一見すると、SnapRAID私は好きなように動作するようですが、ディスクアレイ用に作成されたのは私の問題です。私考える1 つのデータディスクと 1 つのパリティディスクしか使用できません。この場合、パリティディスクは(バックアップ)データディスクですが、わかりません。

それ以外にも、ファイルチェックサム、これを確認する機能、バックアップからファイルを回復する機能(パリティ)など、私の要件を満たしています。病気まだバックアップは外部メディアで毎週実行されますが、このローカルバックアップは管理が面倒であるため、手動操作が少なくて済みます。

SnapRAID自動チェックサム/バックアップで保護された1つのデータディスクまたはファイルシステムでのみ機能する他の同様のツールがありますか、それともそれを使用する必要がありますかSnapRAID?ディスク1枚しかなくても正常に動作しますか?

なぜならパリティディスクバックアップの場合は、ローカルバックアップディスクを使用する前に完全に消去する必要があるSnapRAIDため、確認なしに直接「テスト」することは躊躇します。この場合の1つの欠点は、パリティディスクが通常のディスクのようにアクセスできないことです。本物パリティディスクですがミラーだけです。

したがって、バックアップを処理するために使いやすい同様のツールがある場合と文書の整合性ディスクアレイではなくディスク1つについて知りたいです。ありがとうございます。

答え1

あなたは少し見なければなりません。ブープ

git packfile形式に基づく非常に効率的なバックアップシステムで、高速増分保存とグローバル重複排除(仮想マシンイメージを含むファイル間および内部)を提供します。

Bup サポートbup-fsck(そして2ストローク)

bup リポジトリの確認または回復

答え2

以下はもう少し軽いオプションです(鉱山)。

https://github.com/laktak/chkbit-py

プライマリメディアとバックアップメディアのデータ整合性を確認できるハッシュを作成します。

答え3

長い間接続していないファイルがランダムに破損しているのだろうか?

これが創作動機の一つです。データプリント、データ統計、指紋採取、検証のためのJordialのフリーソフトウェアです。 DatimprintはJavaで書かれているので、Linux、Mac、Windowsで動作します。最新のファイルAPIとコーディング標準を使用し、高速ファイルシステムのナビゲーションとチェックサム処理にマルチスレッドを使用します。

Datimprintはディレクトリツリーの「データインプリント」を作成し、それを次の場所に保存します。データファイル

datimprint generate /var/data --output /var/imprints/data-2022-11-12.datim

たとえば、後でインプリントファイルと比較してデータツリーを確認してバックアップを確認したり、データの劣化を確認したりできます。

datimprint check /var/backup/data --imprint /var/imprints/data-2022-11-12.datim

ソースコードは次のように公開されています。GitHubプロジェクト

…可能であれば、問題が解決することを願っています。

特定のバックアップに基づいてファイルを回復すると、将来の改善が可能になります。 Datimprintの作成者として新機能をリクエストしたり、バグを報告してください。質問。以下から追加のフィードバックを提供できます。議論するプログラムについて。

答え4

ディスクアレイの代わりに1つのディスクに対するファイルの整合性

ZFSについて話しているわけではないことを知っていますが、ここで考慮すべきハッキングがあります。ローカルバックアップドライブに対してこれを実行しました。

  1. ドライブを11の同じパーティションに分割する
  2. 各パーティションを別々の「デバイス」として使用します。 ZFSを使用してRaid5でフォーマットします。 (私は実際にBTRFSを使用していますが、危険を知っています。)

単一のデバイスとしてインストールされます。 10個のパーティションスペースはデータ用に使用され、1個のパーティションスペースはパリティ用に使用されます。これにより、ファイルを変更するたびにすべてのデータの10%パリティが即座に提供されます。管理者はほとんどいません。月に一度だけクリーンアップしてください。

関連情報