WgetやCurlなどのツールを使ってフォーラムjpeg画像の添付ファイルをダウンロードする方法はありますか?フォーラムの特定のページからJPEG添付ファイルをダウンロードしたいと思います。すべてのフォーラムの添付ファイルをダウンロードしたくなく、スレッドのページに関連する添付ファイルをダウンロードしたいと思います。また、添付ファイルを一度に1つずつダウンロードしたくありません。フォーラムのページにアクセスし、1つのコマンド/タスクを使用してそのページに添付されているすべての画像をダウンロードできるようにしたいです。
Firefoxアドオンを使用してフォーラムの添付URLを検索できますか?すべてのリンクをコピー:
http://forum.sample.com/attachmentshow.php?attachmentid=5332197&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332198&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332199&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5683368&d=1407242372
ただし、WgetやCurl(または他のツール)にフォーラムページのURLを提供すると、コマンドが自動的に添付ファイルのURLを取得して画像をダウンロードできるようになると便利です。
答え1
URLにファイル名サフィックスを使用しない画像やファイルへのリンクを取得するには、この--accept-regex
オプションと一緒にwgetを使用します。あなたの特定の状況に応じて使用するスクリプトを変更しました。
wget -nd -r -l 2 --accept-regex '/attachmentshow' www.domain.tld
説明する:
-nd
再帰的に検索するときにディレクトリ階層が生成されるのを防ぐディレクトリはありません。-r
再帰検索の有効化、リファレンス再帰ダウンロードもっと学ぶ。-l
再帰最大深度レベルを指定します。これを特定の意図に合わせて変更できます。--accept-regex
URL を受け入れる正規表現を指定します。
また、それを使用して-A
許可する必要があるファイル名のサフィックスを指定することもできます。再帰的承認/拒否オプションもっと学ぶ。
会ったときロボット.txt-e robots.off
このオプションを使用してrobots.txtファイルを上書きできます。まず、このオプションとその結果についてお読みください。
wgetについてもっと読むことができます。マニュアルページ。
あなたのニーズに合わせて例を適用し、問題を解決できることを願っています。