Wget - 特定のURL文字列を含む画像をダウンロードする

Wget - 特定のURL文字列を含む画像をダウンロードする

次のURLを含むすべてのJPEGをダウンロードできるWgetコマンドはありますか?

http://www.sample.com/images/imag/

したがって、その特定のURLの下のすべてのjpegは、次のようにダウンロードされます。

JPEGの命名規則が異なるかどうかにかかわらず。

答え1

wget -r -A jpg,jpeg http://www.sample.com/images/imag/

これにより、ディレクトリツリー全体が作成されます。ディレクトリツリーが必要ない場合は、次を使用します。

wget -r -A jpg,jpeg -nd http://www.sample.com/images/imag

またはに接続して(たとえば、SSH経由で)フォルダをsample.com探します。/images/imagls *.jp* > foo.txtwget -i -F foo.txt -B http://www.sample.com/images/imag/foo.jpg

答え2

「得る」方法によって異なります。http://www.sample.com/images/imag/画像のリスト。

ページにHTML文書の画像が含まれている場合は、次のことを試すことができます。

wget -nd -p -A jpg,jpeg -e robots=off http://...

どこ:

  • -nd:ディレクトリがありません。--no-directories
  • -p:画像が含まれています(ページによっては必須)。--page-requisites
  • -A:許可するファイル名のサフィックスまたはパターンのカンマ区切りリスト。--accept
  • -e:コマンドの一部であるかのようにコマンドを実行します。.wgetrc--execute
    • ここ;ボット=オフ

一部のサーバーは圧縮されたHTML(gzipなど)のみを提供します。その後、wgetはそれら(AFAIK)を解凍して解析しないため、いくつかの追加手順を実行する必要があります。かなり迅速で痛みのない解決策は、次のものを使用することです。隠れ

インストール後、次の手順を実行してwgetプロキシを使用します。

export http_proxy="http://localhost:8118"

その後、コマンドを再実行してください。

関連情報