HTMLディレクトリリストからファイルリストを取得する

HTMLディレクトリリストからファイルリストを取得する

すべてのファイルを取得できます。バッシュパッチサイト順番にダウンロードしてください。

SEQ=$(seq -f "%03g" 1 30)
for i in $SEQ; do 
  wget http://ftp.gnu.org/gnu/bash/bash-4.3-patches/bash43-$i;
done

ただし、最大数を知る必要があります。

リストをインポートしてダウンロードするすべてのパッチファイルを抽出することは可能ですか?

答え1

wget再帰ダウンロードを使用できます。

wget -nc -nd -nH -np -r -R '*.*'  http://ftp.gnu.org/gnu/bash/bash-4.3-patches/

説明する:

  • -nc:no-clobber(既存のファイルを上書きしない)は必要ないかもしれません。
  • -nd: ディレクトリ階層を作成しないでください。
  • -nH:ホスト名に基づいてディレクトリを作成しないでください。あるいは、すべてがディレクトリにダウンロードされているのを見ることもできますftp.gnu.org
  • -np:親ディレクトリに昇格しないでください。
  • -r:再帰的ダウンロード。
  • -R '*.*'.ファイル名にが含まれている項目はすべて拒否されます(そのような項目はスキップindex.html)。受け入れリストも利用できます。ファイルがダウンロードされたが削除されました

答え2

for i in $(seq -f "%03g" 1 999); do 
  wget http://ftp.gnu.org/gnu/bash/bash-4.3-patches/bash43-$i
  if [[ $? -ne "0" ]]; then
    MAX=$(expr $i - 1)
    break;
  fi
done
echo $MAX files downloaded

関連情報