wget
1つの開始URL(各前提条件を含む)から繰り返しダウンロードし、同じ操作を実行するために別のパスを含める方法はありますか?
これをより明確にするために、このファイルは複数の画像、スタイルシートなどにリンクされindex.html
ています。http://www.domain1.com/path1/index.html
これがこの-p
オプションの目的です。しかし、index.html
リンク(もちろん前提条件を含む)もダウンロードしたい場合はどうすればいいですか?http://www.domain2.com/path2/site.html
2番目のWebサイトがsite.html
別のWebサイトにリンクされている場合は、そのWebサイトを含めないでください。
オプションで2番目のパスを追加しようとしましたが、--accept-regex
目的のアクションは生成されません。
答え1
あなたの例を使って達成したい目標を達成するために、wgetにいくつかの異なる制限を設定できます。
関連オプション:
-D
許可されたドメインのカンマ区切りリストを提供できます。たとえば、これにより、-D domain1.com,domain2.com
これら2つのドメインからのみファイルをダウンロードできます。
-l
最大再帰深度を指定できます。独自の解釈を使用します。たとえば、-l 1
domain1のindex.htmlがdomain2のsite.htmlにリンクされている場合、site.htmlはダウンロードされますが、site.htmlは何も接続されません。-l
制限はかなり高くなりますが、必要なファイルをすべて取得するためにさまざまな制限を使用して複数回実行できますwget
。