オフラインナビゲーションには、このコマンドを使用してWebページを手順5に繰り返しダウンロードします。
wget -r -p --convert-links http://www.pythondiario.com
ところで、画像が正しくダウンロードされません。
どうすれば解決できますか?
答え1
〜のように桂里コメントで述べたように、このページの一部の画像は他のホストでホストされています。デフォルトでは、wgetはホスト間リンクをたどりません(これはイメージの検索と再帰の巡回に適用されます)。
wgetがクロスホストリンクに従うようにするには、この-H
オプションを渡します。通過するホストを制限するには、このオプションを渡すことをお勧めします-D
。そうしないと、リンクされたコンテンツを一括ダウンロードする危険があります。
wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com
これを参考にして-H
、-D
画像だけでなく再帰巡回にも適用してください。-R
または、オプションを追加してホスト間のリンクをさらに制限することもできます--reject-regex
。
バラよりマニュアルの「クロスホスト」詳細については。