すべてのファイルでURLアドレスを選択して出力する方法は？ [コピー]

2024-5-26 • tag-icon

どのコマンドが実行されるのか知りたいです。

ファイルのすべてのURLを選択します（たとえば、最初から最後までhttpまたはwwwで始まるすべてのアドレスを識別し、それをテキストまたは他のデータから切り離します）。
.txt ファイルに出力します。

次のアイデアは、.txtファイルでwget -iを実行することです。 wgetは元のファイルのすべてのURLを直接認識するのが難しいので、これらのURLを選択して.txtファイルから正しく出力する必要があります。

私は以下の指示に従いました。grepを使用してスクリプトを挿入してHTMLファイルからWebサイトのURLを取得する方法私の場合、URLは入力ファイルの<href>の間にあったのでうまくいきました。

grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt

関連情報