wgetは304 Not Modifiedを含むファイルをダウンロードできません。

wgetは304 Not Modifiedを含むファイルをダウンロードできません。

再帰を使用してウェブサイトをダウンロードしようとしていますwget

wget --recursive --page-requisites --no-parent --convert-links -e robots=off --domains orteil.dashnet.org orteil.dashnet.org/cookieclicker

特定のファイルのみをダウンロードし、他のファイルは維持します。詳しく調べたところ、返されたファイルをダウンロードしていないことがわかりました304 Not Modified

ファイルは304 Not Modifiedインスペクタに返され、ダウンロードされません。 ファイルは304を返します。

ファイルは200 OKインスペクタに返され、ダウンロードされます。 200個のファイルを返す

.wget304

答え1

304 Not Modified はサーバーから応答If-Modified-Sinceヘッダーに送信されます。お客様のコピーが最新バージョンであることをお知らせください。wgetファイルはいくつかのタイムスタンプと共に出力ディレクトリにすでに存在するため、このヘッダーは順番に送信されます。

したがって、強制的にダウンロードする確実な方法は、空の出力ディレクトリから始めることです。

ファイルのタイムスタンプが変更され(したがってより最新に見えるように)、代わりに使用しているため、--convert-links問題が発生する可能性があります--backup-converted--convert-links

編集:wget私がテストしたものより最近は、次のものを追加することもできます。--no-if-modified-since

関連情報