一方向同期ディレクトリですが、削除されたファイルはターゲットに保存されます。

一方向同期ディレクトリですが、削除されたファイルはターゲットに保存されます。

2つのシステム間でディレクトリを同期したいと思います。より興味深くするために、同期は一方向にのみ実行できます。つまり:

  • ソースディレクトリからファイルを削除した場合は、以前に送信されたファイルもターゲットディレクトリから削除する必要があります。
  • ターゲットディレクトリから削除されたファイルは、ソースディレクトリから削除しないでください。
  • 部分的に転送されたファイル(ネットワークの問題など)は、次の同期時に完了する必要があります。
  • ソースディレクトリの新しいファイルをターゲットディレクトリに転送する必要があります。
  • ターゲットディレクトリから削除されたファイルは再送信されない可能性があります。

つまり、ソースシステムはデフォルトでマスターの役割を持ちますが、ターゲットシステムから削除されたファイルは強制的に回復されません。

どちらのLinuxシステムでもrsync / ssh / scpを使用できます。

ソースディレクトリの新しいファイルは、mtimeを使用して検出できる方法で作成されます。例:

if mtime(file) > date-of-last-sync then: it is a new file that needs to be transfered

また、ソースディレクトリの既存のファイルは変更されません。つまり、同期時にすでに(完全に)転送されたファイルの違いを確認する必要はありません。

答え1

リモートファイルシステムを転送されたコンテンツのデータソースとして使用する予定がない場合は、以前に正常に転送されたファイルを外部で追跡し、将来の転送から除外する必要があります。

rsync以下に基づいてファイルを含めるか除外できます。模様転送時に特定のファイルのリストを含めるようにファイルに保存します。これにより、このリストは将来の転送から除外されます。

#!/usr/bin/env bash

set -e

track_dir=~/.track_xfer
inc_file="$track_dir/include_files"
exc_file="$track_dir/exclude_files"
xfer_dir=~/testrsync
xfer_dest=~/testrsync_dest

mkdir -p "$track_dir"
touch $exc_file
cd "$xfer_dir"

# find files and create rsync filter list
find . -type f -print0 | perl -e '
  $/="\0"; 
  while (<>){ 
   chomp; 
   $_ =~ s!^\.!!;    # remove leading .
   $f = quotemeta;   # quote special chars
   $f =~ s!\\/!/!g;  # fix quoted paths `/`
   print $f."\n"; 
  }' > "$inc_file"

# Run the rsync
rsync -va --delete --exclude-from "$exc_file" --include-from "$inc_file" "$xfer_dir/" "$xfer_dest"

# Add the included/transferred files to the exclusion list
cat "$inc_file" "$exc_file" > "$exc_file".tmp
sort "$exc_file".tmp | uniq > "$exc_file"

より具体的な正規表現参照が必要かもしれませんが、rsyncPerlquotemeta機能と交換が私の心に浮かぶ最初の簡単な解決策です。

主な問題は、ファイル名の特殊文字を処理することです。名前の新しい行、タブ、その他の奇妙な項目を処理するには、perlパターンリストを含む(または何でも)解析して作成するためにさらに多くの作業を行う必要があります。転送されるファイルの名前を単純な文字セットに制限できる場合は、この手順を心配する必要はありません。perl最も一般的な正規表現文字を克服するのに役立つトレードオフソリューションは次のとおりです。

rsyncディレクトリ全体を独自にインポートするのではなく、インクルードリストを使用する理由は、後続の除外リスト用に定義された/完全なファイルリストを持つことです。転送されたファイルrsyncや出力を解析して--log-file=FILE同じ結果を得ることもできますが、少し難しいようです。

答え2

Rsyncは必要な操作を正確に実行しますrsync -a --delete-x例:selinuxの場合はxattrsが必要な場合は追加)。

Rsync はソースのファイルを決して削除しませんが、--deleteソースに存在しないターゲットのファイルはすべて削除します。

増分更新メカニズムを介して部分的に転送されたファイルを更新します。 AFAIR rsyncは最初にmtime(+ファイルサイズ)をチェックし、不一致がある場合は指紋の採取と増分の更新のみを完了します。

答え3

すべての質問に対する回答を提供するので、マニュアルページを読んでください。このコマンドを実行するman rsyncと、マニュアルページが表示されます。

rsync はファイルが変更されていないことを確認します。これは非常に効率的であり、伝送のrsync時間を著しく遅くしなかった。最後の実行直後にrsync実行時間を測定することで、必要な時間を見積もることができます。

rsync は一方向同期であり、ソースを変更しません。ソースファイルを読み取ることができ、書き込み権限を持たないユーザーIDを安全に使用できます。しかし、必ずしもそうする必要はありません。

rsync を再実行すると、部分的に完了した転送が再開されます。

rsync は、削除オプションのいずれかを使用する場合にのみ、ターゲットのファイルを削除します。

編集:ターゲットディレクトリから削除されたファイルが再送信されないようにするには、そのファイルの除外リストを作成する必要があります。更新されても転送から除外されます。あるいは、ファイルを削除するのではなく、ファイルを切り捨ててその--updateフラグを使用することもできます。切り捨てられた後、更新されたファイルがコピーされます。

増分tarバックアップを使用すると、要件をよりよく満たすことができます。あるtarの出力はSSH接続を介して別のtarにパイプすることができます。これにより、最後のバックアップ以降に作成または変更されたすべてのファイルが選択されますが、他のファイルは転送されません。

関連情報