便利なオプションは、ダウンロードしたHTMLまたはCSSのリンクがローカルファイルを指すようにすることwget --convert-links
です。wget -k
2つのパスを実行します。
- ステップ1:ファイルをダウンロードします。
- ステップ2:リンクを変換します。
今1段階をして後で2段階をしたいと思います。これら2つのチャンネルを別々に呼び出したいです。wget
最初のパスの後は停止し、2番目のパスを続行する前に何かをするようにしたいと思います。リンクをコマンドであれwget
他のコマンドであれ、別のコマンドに変換したいと思います。どうですか?
これを実行できない場合、wget
これを実行できるPerlモジュール、Pythonモジュール、または類似のモジュールはありますか?
(参考として:この回答私の質問に部分的に答えました。この問題似ていますが、答えは失敗したようです。とにかく、私が知っている限り、どちらも実際に効果的なものを提供しません。 )
答え1
この質問は実際に他の場所で答えられたようです。質問しかし、古いので、現在の解決策は次のとおりです。
wget
「Pass 1」の後に、ローカルディレクトリを渡してウェブサイトと信じるようにすることが含まれます。これは短いPythonコードを呼び出すことで簡単に行うことができます。単純なHTTPリクエストハンドラその後、wget
適切なオプションを使用してlocalhostから再起動します。
道にあるものこの行働くでしょう:
import http.server
import socketserver
import os
PORT = 8000 # optional, can be changed
web_dir = os.path.join(os.path.dirname(path), 'web') # change path to your local files here if needed, like '/home' or 'C:\\tmp' on Windows
os.chdir(web_dir)
Handler = http.server.SimpleHTTPRequestHandler
httpd = socketserver.TCPServer(("", PORT), Handler)
print("serving at port", PORT)
httpd.serve_forever()
だからあなたwget
に電話してください。http://localhost:8000