複数行の開始タグと終了タグを使用してパターン別にテキストを取得する[重複]

Question 1

私の考えでは、あなたの問題は、貪欲ではないマッチがあなたが望むよりも多く食べることができるということです。終わり砂スタートS.これはうまくいくようです：

grep -Pzo '(?s)START(?:(?!END).)*?bar(?:(?!START).)*?END' file.txt

例のすべてのケースをカバーし、完了した場合>> file.txt

bar
START
test7
END

まだ有効です。

Answer

私の考えでは、あなたの問題は、貪欲ではないマッチがあなたが望むよりも多く食べることができるということです。終わり砂スタートS.これはうまくいくようです：

grep -Pzo '(?s)START(?:(?!END).)*?bar(?:(?!START).)*?END' file.txt

例のすべてのケースをカバーし、完了した場合>> file.txt

bar
START
test7
END

まだ有効です。

Question 2

レコード区切り文字を指定できる場合は、awkを使用します。レコード区切り文字が「END」（1行に）の場合は、「bar」を含むレコードを探します。

awk 'BEGIN {RS = ORS = "\nEND\n"} /bar/' file.txt

STARTタグとENDタグの間に表示されるプロセステキスト。この変更はハッキングされているように感じますが、この場合は機能します。 END をレコード区切り文字として使用し、START キーワードの前のすべてのテキストを削除します。

awk '
    BEGIN {RS = ORS = "\nEND\n"} 
    {sub(/^.*\nSTART\n/, "START\n")} 
    /bar/
' file.txt

ENDの前に「START」が複数回表示されると、目的の結果が出ないことがあります。

foo
START
hello
START
bar
world
END
baz

次のように出力されます。

START
bar
world
END

Answer

レコード区切り文字を指定できる場合は、awkを使用します。レコード区切り文字が「END」（1行に）の場合は、「bar」を含むレコードを探します。

awk 'BEGIN {RS = ORS = "\nEND\n"} /bar/' file.txt

STARTタグとENDタグの間に表示されるプロセステキスト。この変更はハッキングされているように感じますが、この場合は機能します。 END をレコード区切り文字として使用し、START キーワードの前のすべてのテキストを削除します。

awk '
    BEGIN {RS = ORS = "\nEND\n"} 
    {sub(/^.*\nSTART\n/, "START\n")} 
    /bar/
' file.txt

ENDの前に「START」が複数回表示されると、目的の結果が出ないことがあります。

foo
START
hello
START
bar
world
END
baz

次のように出力されます。

START
bar
world
END

Question 3

perl -nE 'BEGIN {$/="\nEND\n"} say /(START.*test.*)/s'

@bobbelが指摘したように、空行区切り文字を避けるには、次のようsayに置き換えます。print

Answer

perl -nE 'BEGIN {$/="\nEND\n"} say /(START.*test.*)/s'

@bobbelが指摘したように、空行区切り文字を避けるには、次のようsayに置き換えます。print

修正する: