ホームページはこんな感じです
実際のウェブサイトは仕事中なので追加できません。
これらのファイルにはバージョン番号はありませんが、名前が異なります。最新のファイルへのリンクもありません。これは非常に小さなサイトです。
タイムスタンプを通じて、どちらが最新かを知ることができます。
アイデア
curl
Webページで配列にファイルを追加し、インデックスの最後のファイルをダウンロードします。curl
curl
Webページで各ファイルをアップロード日順に並べ替えた後、現在の日付からアップロード日を引いた後、時間差がcurl
最も小さいファイルをダウンロードする場合は?date
秒に変換するために使用しています。
Bash ソリューションを開きます。
より良い考えがありますか?
答え1
ハッキング方式を使用する一般的なアプローチは次のとおりです。lftp
次のように解析できます。
lftp -e "find -l; quit" https://releases.wikimedia.org/mediawiki/
基本ツールを使用して解析した例:
lftp -e "find -l; quit" https://releases.wikimedia.org/mediawiki/ |
awk '{print $3"-"$4, $5}' |
sort |
tail -n1 |
cut -d ' ' -f2
リモートWebサイトから最新のファイルを生成します。