.mp3
HTMLページからファイルをインポートする方法を考えていましたが、手動で使用しました。wget
wget http://www.podcastfrancaisfacile.com/wp-content/uploads/files/question-prix.mp3
だから私はすべてのmp3ファイルを自動的にインポートするためにこの方法を試しました。
grep -i -E -o "content="http://www.podcastfrancaisfacile.com/wp-content/uploads/files/*.mp3" "$thread" | sed 's/ /_/g' - > "$names"
ここで、 " $thread
"はhtmlファイルの名前、 " $names
"は出力されるファイル名のリストです。
そして
sed -ne 's/.*\(http[^"]*\).*/\1/p' < "$thread"
関連
答え1
次のスクリプトは、.mp3
HTMLファイルの変数に含まれるすべてのリンクまたはURLをダウンロードします$thread
。lynx -dump -listonly
これは、シェルスクリプトがHTMLファイルまたはURLからURLリストを抽出する最も簡単で便利な方法の1つであることを利用します。
スクリプトを使用するには、ファイルがリストされているインデックスページのURLを知る必要があります.mp3
。または、ダウンロードしたページのコピーを含むファイル名です。
http://www.podcastfrancaisfacile.com/mp3-list.html
インデックスURLが何であるか言及していないので、偽のURLを例として使用します。正しいURLまたはファイル名に変更してください。
#! /bin/bash
thread='http://www.podcastfrancaisfacile.com/mp3-list.html'
#thread='mp3-list.html'
while IFS= read -r url ; do
wget "$url"
done < <(lynx -dump -listonly "$thread" | awk '/\.mp3$/ {print $2}')
答え2
使用wget
できる再帰検索オプション。たとえば、
$ wget \
-e robots=off \
--accept '*.mp3' \
--level=1 \
--recursive \
--no-directories \
"${thread}"