次のURLを含むすべてのJPEGをダウンロードできるWgetコマンドはありますか?
http://www.sample.com/images/imag/
したがって、その特定のURLの下のすべてのjpegは、次のようにダウンロードされます。
- http://www.sample.com/images/imag/%281665%29-253.jpg
- http://www.sample.com/images/imag/(2816)-2234.jpg
- http://www.sample.com/images/imag/32r4344sdfa.jpg
- http://www.sample.com/images/imag/dwedjpao.jpg
JPEGの命名規則が異なるかどうかにかかわらず。
答え1
wget -r -A jpg,jpeg http://www.sample.com/images/imag/
これにより、ディレクトリツリー全体が作成されます。ディレクトリツリーが必要ない場合は、次を使用します。
wget -r -A jpg,jpeg -nd http://www.sample.com/images/imag
またはに接続して(たとえば、SSH経由で)フォルダをsample.com
探します。/images/imag
ls *.jp* > foo.txt
wget -i -F foo.txt -B http://www.sample.com/images/imag/foo.jpg
答え2
「得る」方法によって異なります。http://www.sample.com/images/imag/画像のリスト。
ページにHTML文書の画像が含まれている場合は、次のことを試すことができます。
wget -nd -p -A jpg,jpeg -e robots=off http://...
どこ:
-nd
:ディレクトリがありません。--no-directories
-p
:画像が含まれています(ページによっては必須)。--page-requisites
-A
:許可するファイル名のサフィックスまたはパターンのカンマ区切りリスト。--accept
-e
:コマンドの一部であるかのようにコマンドを実行します。.wgetrc。--execute
- ここ;ボット=オフ
一部のサーバーは圧縮されたHTML(gzipなど)のみを提供します。その後、wgetはそれら(AFAIK)を解凍して解析しないため、いくつかの追加手順を実行する必要があります。かなり迅速で痛みのない解決策は、次のものを使用することです。隠れ。
インストール後、次の手順を実行してwget
プロキシを使用します。
export http_proxy="http://localhost:8118"
その後、コマンドを再実行してください。