wgetまたは他のコマンドを使用してすぐにダウンロードし、後でリンクを変換するにはどうすればよいですか?

wgetまたは他のコマンドを使用してすぐにダウンロードし、後でリンクを変換するにはどうすればよいですか?

便利なオプションは、ダウンロードしたHTMLまたはCSSのリンクがローカルファイルを指すようにすることwget --convert-linksです。wget -k2つのパスを実行します。

  • ステップ1:ファイルをダウンロードします。
  • ステップ2:リンクを変換します。

今1段階をして後で2段階をしたいと思います。これら2つのチャンネルを別々に呼び出したいです。wget最初のパスの後は停止し、2番目のパスを続行する前に何かをするようにしたいと思います。リンクをコマンドであれwget他のコマンドであれ、別のコマンドに変換したいと思います。どうですか?

これを実行できない場合、wgetこれを実行できるPerlモジュール、Pythonモジュール、または類似のモジュールはありますか?

(参考として:この回答私の質問に部分的に答えました。この問題似ていますが、答えは失敗したようです。とにかく、私が知っている限り、どちらも実際に効果的なものを提供しません。 )

答え1

この質問は実際に他の場所で答えられたようです。質問しかし、古いので、現在の解決策は次のとおりです。

wget「Pass 1」の後に、ローカルディレクトリを渡してウェブサイトと信じるようにすることが含まれます。これは短いPythonコードを呼び出すことで簡単に行うことができます。単純なHTTPリクエストハンドラその後、wget適切なオプションを使用してlocalhostから再起動します。

道にあるものこの行働くでしょう:

import http.server
import socketserver
import os

PORT = 8000 # optional, can be changed

web_dir = os.path.join(os.path.dirname(path), 'web') # change path to your local files here if needed, like '/home' or 'C:\\tmp' on Windows
os.chdir(web_dir)

Handler = http.server.SimpleHTTPRequestHandler
httpd = socketserver.TCPServer(("", PORT), Handler)
print("serving at port", PORT)
httpd.serve_forever()

だからあなたwgetに電話してください。http://localhost:8000

関連情報