オフラインで閲覧できるようにWebサイトをダウンロードしようとしていますが、html、画像、css、javascriptなどが必要です。
問題は、すべての画像がWebサイトと同じドメインでホストされておらず、CSSとJavaScriptもホストされていないことです。一部の画像はimgurからインポートされ、他の画像は他のファイル共有サイトからインポートされます。つまり、このサイトで使用されるリソースを保持するドメインがたくさんあります。
単一のドメインからhtmlをダウンロードしながら、そのhtmlが使用するリソースをすべてのドメインから取得するにはどうすればよいですか?
答え1
パラメータセットを使用する必要があります。ホストスパニング:
主に:
-H
指定されたホスト以外のホストに移動-D
含めるドメインの指定--exclude-domains
除外するドメインの指定
たとえば、
wget -rH --exclude-domains flickr.com myownsite.com