再帰を使用してウェブサイトをダウンロードしようとしていますwget
。
wget --recursive --page-requisites --no-parent --convert-links -e robots=off --domains orteil.dashnet.org orteil.dashnet.org/cookieclicker
特定のファイルのみをダウンロードし、他のファイルは維持します。詳しく調べたところ、返されたファイルをダウンロードしていないことがわかりました304 Not Modified
。
ファイルは304 Not Modified
インスペクタに返され、ダウンロードされません。
ファイルは200 OK
インスペクタに返され、ダウンロードされます。
.wget
304
答え1
304 Not Modified はサーバーから応答If-Modified-Since
ヘッダーに送信されます。お客様のコピーが最新バージョンであることをお知らせください。wget
ファイルはいくつかのタイムスタンプと共に出力ディレクトリにすでに存在するため、このヘッダーは順番に送信されます。
したがって、強制的にダウンロードする確実な方法は、空の出力ディレクトリから始めることです。
ファイルのタイムスタンプが変更され(したがってより最新に見えるように)、代わりに使用しているため、--convert-links
問題が発生する可能性があります--backup-converted
。--convert-links
編集:wget
私がテストしたものより最近は、次のものを追加することもできます。--no-if-modified-since