wgetがApacheディレクトリリストを別の順序でロードするのを防ぐ方法は何ですか？

Question 1

指摘したとおり回答関連する質問では、wgetのドキュメント説明する：

さらに、クエリ文字列（疑問符（ "？"）で始まるURLの末尾にある文字列）は、実際に選択に影響を与えても受け入れ/拒否ルールのファイル名の一部として含まれません。 Wgetの将来のバージョンでは、クエリ文字列の一致を可能にするオプションが提供されると予想されます。

次のようなさまざまなツールを使用する必要があります。パブクまたはhttrack。これら2つのプログラムは、wgetよりも強力な名前フィルタリングを提供します。

あるいは、wgetを使用してディレクトリをダウンロードして後でフィルタリングすることもできます。

find . -name '*\?' -delete
# Here is a less dangerous pattern that matches the string you provided more closely:
find . -name '*\??=?;?=?' -delete

Answer

指摘したとおり回答関連する質問では、wgetのドキュメント説明する：

さらに、クエリ文字列（疑問符（ "？"）で始まるURLの末尾にある文字列）は、実際に選択に影響を与えても受け入れ/拒否ルールのファイル名の一部として含まれません。 Wgetの将来のバージョンでは、クエリ文字列の一致を可能にするオプションが提供されると予想されます。

次のようなさまざまなツールを使用する必要があります。パブクまたはhttrack。これら2つのプログラムは、wgetよりも強力な名前フィルタリングを提供します。

あるいは、wgetを使用してディレクトリをダウンロードして後でフィルタリングすることもできます。

find . -name '*\?' -delete
# Here is a less dangerous pattern that matches the string you provided more closely:
find . -name '*\??=?;?=?' -delete

Question 2

*.pdfファイルのディレクトリをミラーリングしたい場合は、httrackを使用します。次のコマンドが私に効果的です。

 % httrack http://my.server.com/dir/with/pdfs/ +mime:text/html +*.pdf --update

httrackの詳細については、以下で確認できます。

wgetと比較してhttrackを使用することの主な利点の1つは、httrackが変更/更新されたファイルのみをダウンロードすることです。

Answer

*.pdfファイルのディレクトリをミラーリングしたい場合は、httrackを使用します。次のコマンドが私に効果的です。

 % httrack http://my.server.com/dir/with/pdfs/ +mime:text/html +*.pdf --update

httrackの詳細については、以下で確認できます。

wgetと比較してhttrackを使用することの主な利点の1つは、httrackが変更/更新されたファイルのみをダウンロードすることです。

関連情報