特定のデータから値を抽出するWebページをブロック

Question

curl http://webpage.example.com/status             |\
    grep -oP '<div class="stats-values">.*?</div>' |\
    grep -oP '(?<=<span>)\[.*?\](?=</span>)'

まずgrep関連<div ...></div>ブロックを抽出し、
2番目のステップgrepは内部ブロック内のデジタル部分を抽出することです<span>[...]</span>。

(?<=pattern)grepPCREは、スイッチで使用するために有効にしたGNUの逆方向拡張です-P。
(?=pattern)これから拡張を模索しているPCREです。

これは(?<=<span>)\[.*?\](?=</span>)、私たちのパターンがこれら2つのパターン内に完全に含まれることを意味します[nuerical]。このパターンは出力に含まれず、一致し、見つかった内部パターンのみが返されます。

.*貪欲な一致（可能な限り長い一致）です。.*?貪欲ではありません（できるだけ短い一致）。

Answer 1

curl http://webpage.example.com/status             |\
    grep -oP '<div class="stats-values">.*?</div>' |\
    grep -oP '(?<=<span>)\[.*?\](?=</span>)'

まずgrep関連<div ...></div>ブロックを抽出し、
2番目のステップgrepは内部ブロック内のデジタル部分を抽出することです<span>[...]</span>。

(?<=pattern)grepPCREは、スイッチで使用するために有効にしたGNUの逆方向拡張です-P。
(?=pattern)これから拡張を模索しているPCREです。

これは(?<=<span>)\[.*?\](?=</span>)、私たちのパターンがこれら2つのパターン内に完全に含まれることを意味します[nuerical]。このパターンは出力に含まれず、一致し、見つかった内部パターンのみが返されます。

.*貪欲な一致（可能な限り長い一致）です。.*?貪欲ではありません（できるだけ短い一致）。

特定のデータから値を抽出するWebページをブロック

答え1

関連情報