AWK、SED、または GREP は、HTML ファイルからデータを抽出するために使用されます。

Question 1

非常にエレガントではありませんが、次のことができます。

sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\)&nbsp.*/\1/p'

たとえば、

$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\)&nbsp.*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions

Answer

非常にエレガントではありませんが、次のことができます。

sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\)&nbsp.*/\1/p'

たとえば、

$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\)&nbsp.*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions

Question 2

そして：grepawk

grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'

Answer

そして：grepawk

grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'

AWK、SED、または GREP は、HTML ファイルからデータを抽出するために使用されます。

答え1

答え2

関連情報