wget再帰問題

wget再帰問題

wget1つの開始URL(各前提条件を含む)から繰り返しダウンロードし、同じ操作を実行するために別のパスを含める方法はありますか?

これをより明確にするために、このファイルは複数の画像、スタイルシートなどにリンクされindex.htmlています。http://www.domain1.com/path1/index.htmlこれがこの-pオプションの目的です。しかし、index.htmlリンク(もちろん前提条件を含む)もダウンロードしたい場合はどうすればいいですか?http://www.domain2.com/path2/site.html2番目のWebサイトがsite.html別のWebサイトにリンクされている場合は、そのWebサイトを含めないでください。

オプションで2番目のパスを追加しようとしましたが、--accept-regex目的のアクションは生成されません。

答え1

あなたの例を使って達成したい目標を達成するために、wgetにいくつかの異なる制限を設定できます。

関連オプション:

-D許可されたドメインのカンマ区切りリストを提供できます。たとえば、これにより、-D domain1.com,domain2.comこれら2つのドメインからのみファイルをダウンロードできます。

-l最大再帰深度を指定できます。独自の解釈を使用します。たとえば、-l 1domain1のindex.htmlがdomain2のsite.htmlにリンクされている場合、site.htmlはダウンロードされますが、site.htmlは何も接続されません。-l制限はかなり高くなりますが、必要なファイルをすべて取得するためにさまざまな制限を使用して複数回実行できますwget

関連情報