ウェブサイトから最新のタイムスタンプを含むファイルをダウンロードする[閉じる]

ウェブサイトから最新のタイムスタンプを含むファイルをダウンロードする[閉じる]

ホームページはこんな感じです

ここに画像の説明を入力してください。

実際のウェブサイトは仕事中なので追加できません。

これらのファイルにはバージョン番号はありませんが、名前が異なります。最新のファイルへのリンクもありません。これは非常に小さなサイトです。

タイムスタンプを通じて、どちらが最新かを知ることができます。

アイデア

  • curlWebページで配列にファイルを追加し、インデックスの最後のファイルをダウンロードします。curl

  • curlWebページで各ファイルをアップロード日順に並べ替えた後、現在の日付からアップロード日を引いた後、時間差がcurl最も小さいファイルをダウンロードする場合は?date秒に変換するために使用しています。

Bash ソリューションを開きます。

より良い考えがありますか?

答え1

ハッキング方式を使用する一般的なアプローチは次のとおりです。lftp次のように解析できます。

lftp -e "find -l; quit" https://releases.wikimedia.org/mediawiki/

基本ツールを使用して解析した例:

lftp -e "find -l; quit" https://releases.wikimedia.org/mediawiki/ |
    awk '{print $3"-"$4, $5}' |
    sort |
    tail -n1 |
    cut -d ' ' -f2

リモートWebサイトから最新のファイルを生成します。

関連情報