私はこのウェブサイトでwgetを実行しました:http://demo.codestag.com/geeklove/しかし、index.htmlだけを返します。
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domains --no-parent http://demo.codestag.com/geeklove
私は次のようにユーザーエージェントをなりすまします。http://www.askapache.com/linux/wget-header-trick.html#Testing_Wget_Trickしかし、まだ動作しません。
--debug オプションを使用すると、他のすべてのページをスキップして表示されます。
答え1
オプションは、従う--domains
ドメインのリストを指定します。このオプションの後には何も指定しないため、wgetは直接指定されたファイルのみをダウンロードします。
--domains demo.codestag.com
このオプションを削除するか、次に置き換えるとロボット.txtこのサーバーから。このファイルを無視するには、を指定する必要があります-e robots=off
。
-d
さらに問題がある場合は、()を指定して--debug
wgetに問題があるかどうかを確認するのが常に役立ちます。