
私は定期的に数テラバイトのサーバーデータ(高頻度と低頻度の変更)をバックアップする外部の「保存ボックス」をインストールしたいLinuxサーバー(Ubuntu 16.04)を持っており、おそらくユーザーのプロパティ(所有者/グループ)を追跡しますできます。 )/権限).
これらのストレージボックスプロバイダは、FTP、FTPS、SFTP、SCP、Samba / CIFS、HTTPS、WebDAVなどのプロトコルを提供します。
どのバックアップツールを考慮する必要がありますか? rsyncを提案した場合、まずデータをローカルにマウントしたいので、どのプロトコルをマウントする必要がありますか?ユーザー属性をバックアップすることは可能ですか(たとえば、サーバーとホスト間のユーザーマッピング)。
答え1
実際には、ネットワークの詳細とストレージデバイスの設計方法によって異なります。
ストレージディレクトリをファイルシステムにマウントする必要がある場合は、SMB / CIFSまたはSSHFS(ストレージデバイスで有効なSFTPサポートのみが必要)を使用する必要があります。どちらの場合でも、SMBは一括送信(どちらも勝つ可能性が高い)を除いて、ほぼ常に優れたパフォーマンスを達成します。 NFSv4のサポートを受けることができれば(OEMが何と言ってもUbuntuボックスであれば必ず入手できるはずです)、ほとんどの場合SMB / CIFSとSSHFSよりも優れています。
ネットワークを介してデータを転送したい場合、正直なところ、オプションはあまり良くありません。あなたの場合、通常のFTP(およびSSL経由のFTPであるFTPS)は不便であり、WebDAV(HTTPまたはHTTPS経由)は一括保存シナリオ用に設計されていないため、SFTPとSCPを使用します(DAVはDistributed Authoringの略) 。 WebサーバーにコンテンツをプッシュするためにFTPの代替として設計されているという事実をよく説明するバージョン管理)。理想的な世界では、rsync(送信するファイルが多い場合)を使用するか、netcat(ファイルを1つだけコピーする必要がある場合)を使用します。大きい文書)。
答え2
Duplicityを使用することをお勧めします(ただし、マルチテラバイト規模ではテストしませんでした)。バックエンドが多く、増分バックアップがチャンク(デフォルトでは25MB)に分割され、チャンクのみをダウンロードできます。 、これは実際に必要な復元です。それはうまくいくので、scp / sftpと一緒に使うことをお勧めします。
ネットワーク転送速度でファイルをバックアップする必要がある場合、これらのプロトコルのどれも理想的ではありません。ただし、1つの大規模バックアップの場合は、数ギガバイトの二重性だけを毎日(または毎時)増分バックアップしてもかまいません。
答え3
実装とセマンティックスの間の同型性を破る作業を行わないでください。
クライアントオペレーティングシステムの観点からは、ファイルの所有権は意味的にメタデータです。
バックアップサーバーにファイルがアップロードされると、ファイルのクライアント所有権メタデータではないサーバーオペレーティングシステムの観点から。サーバー上のファイルのメタデータは、次のようにする必要があります。サーバーオペレーティングシステムのファイル所有権。
したがって、サーバーでは、サーバーファイルの元のイメージのメタデータをクライアントに書き込むために別の独立したデータ構造が必要です。たとえば、データベース。
バックアップサーバーの観点からは、そのサーバーのファイルシステム上のファイルは、ファイルの内容が次のような意味を持っていても通常のファイルとして扱われます。クライアントファイルのミラーリング、サーバーオペレーティングシステムはファイルの内容を決して理解できないからです。
実際、ファイルのすべての属性のうち、ファイルがサーバーにアップロードされた後でも、「最後の変更タイムスタンプ」だけがメタデータと見なすことができます。これは、ファイルの内容のバージョンを表すためです。