どのコマンドが実行されるのか知りたいです。
ファイルのすべてのURLを選択します(たとえば、最初から最後までhttpまたはwwwで始まるすべてのアドレスを識別し、それをテキストまたは他のデータから切り離します)。
.txt ファイルに出力します。
次のアイデアは、.txtファイルでwget -iを実行することです。 wgetは元のファイルのすべてのURLを直接認識するのが難しいので、これらのURLを選択して.txtファイルから正しく出力する必要があります。
答え1
私は以下の指示に従いました。grepを使用してスクリプトを挿入してHTMLファイルからWebサイトのURLを取得する方法私の場合、URLは入力ファイルの<href>の間にあったのでうまくいきました。
grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt