awkを使用してHTMLファイルからURLを抽出するには？

Question 1

なぜawkを使うのですか？sedこれをもっとよくしてください：

sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js

Answer

なぜawkを使うのですか？sedこれをもっとよくしてください：

sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js

Question 2

あなたはそれを使用することができますgrep。二重引用符を含めるには、次のようにします。

grep -o '"http://[^"]*"' myfile.html

二重引用符を除外するには、次のようにします。

grep -o 'http://[^"]*' myfile.html

編集する

JavaScriptオブジェクトのURLのみを一致させるには、いくつかの追加のフィルタリングを実行する必要があります。

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'

Answer

あなたはそれを使用することができますgrep。二重引用符を含めるには、次のようにします。

grep -o '"http://[^"]*"' myfile.html

二重引用符を除外するには、次のようにします。

grep -o 'http://[^"]*' myfile.html

編集する

JavaScriptオブジェクトのURLのみを一致させるには、いくつかの追加のフィルタリングを実行する必要があります。

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'

関連情報