Rsyncのファジーデフォルト選択の最適化

Rsyncのファジーデフォルト選択の最適化

rsyncコマンドで「ファジーデフォルトターゲットファイル選択アルゴリズム」を設定できますか?

--fuzzyローカルのProxmoxバックアップをオフサイトに転送するときは、ほとんどの場合、rsyncのパラメータを使用して成功しましたが、時には(詳細なログ記録で)rsync「ファジーベース」に対して無効な既存のターゲットファイルが選択されることがあります。

これは、200GBファイルでこれらの間違いを犯すときに特に無駄です。正しい「ファジーベース」を選択した場合、転送する必要がなかった大量のデータが転送されるためです。

転送中のトリッキーな部分は、ソースフォルダとターゲットフォルダは毎回同じですが、ソースフォルダのすべてのファイル名は転送するたびに異なることです。ただし、「名前が変更された各ファイルの内容」は、以前に名前が付けられたファイルと95%同じです(ターゲットにはまだ以前に転送されたファイルがあります)。

以下は、名前がどのように変更されるかの簡単な例です。

# Source Folder's new files (from today's on-site backup):
file100-2019_09-01_12am.log
file100-2019_09-01_12am.lzo
file101-2019_09-01_12am.log
file101-2019_09-01_12am.lzo
file102-2019_09-01_12am.log
file102-2019_09-01_12am.lzo

# Destination-Folder's old files (from yesterday's off-site backup):
file100-2019_08-31_12am.log
file100-2019_08-31_12am.lzo
file101-2019_08-31_12am.log
file101-2019_08-31_12am.lzo
file102-2019_08-31_12am.log
file102-2019_08-31_12am.lzo

ほとんどの場合、rsyncは正しい「ファジーベース」を選択しますが、時には間違ったベースを選択することもあります。選択エラーのログエントリは次のとおりです。

fuzzy basis selected for file100-2019_08-31_12am.lzo:
file101-2019_09-01_12am.lzo

ご覧のとおり、「Fuzzy Base」をrsync選択してください。ただし、両方のファイルはコンテンツの面で共通点が少ないため、これらの誤った「ファジィベース」の選択によって多くのデータが転送されます。ファイルの正しい「ファジーベース」はです。それではなぜ選択されたのですか?選択肢を選択するために「ファジーデフォルト選択」をどのように最適化できますか?file101...lzofile100...lzofile100-2019_09-01_12am.lzofile100-2019_08-31_12am.lzofile101-2019_08-31_12am.lzofile100-2019_08-31_12am.lzo

私の場合、ファジーベース選択アルゴリズムには次の選択が必要です。既存のターゲットファイルそれ:

  1. ソースファイルとファイル拡張子は同じでなければなりません。
  2. ソースファイルと同じ最も連続した文字で始まる

rsyncコマンドで「ファジーデフォルトターゲットファイル選択アルゴリズム」を設定できますか?

関連情報