SED / AWK：異なるソースファイルの正規表現値と一致する複数のファイルに文字列を追加する

Question 1

複雑Grep+GNUAwk解決策：

主なawkスクリプトの内容は次のとおりですadd_param_by_id.awk。

#!/bin/awk -f
BEGIN{ FS=":[[:space:]]+" }
NR==FNR{ a[$1] = $2; next }
match($0, /\<id="([^"]+)"/, b) && b[1] in a{ 
    sub(/\<id="[^"]+"/, "& some_param=\042"a[b[1]]"\042") 
}1

主なコマンド：

export pat="($(cut -d':' -f1 source.yml | paste -s -d'|'))"
grep -ElZr "\<id=\"$pat\"" --include=*.txt | xargs -0 -I{} sh -c \
'awk -f add_param_by_id.awk source.yml "$1" > "/tmp/$$" && mv "/tmp/$$" "$1"' _ {}

pat- 識別子を含む交互に正規表現グループを含む変数。(apples|grapes|trees|strawberry)
grep -ElZr id=\"$pat\" --include=*.txt- 指定された識別子と一致するすべてのファイル名を印刷します。

処理されたサンプルファイルの内容：

This is some plain text
Toreplace string contains id="apples" some_param="Apples are very tasty"
The most vitamin-rich berry is id="strawberry" some_param="Yummy"

Answer

複雑Grep+GNUAwk解決策：

主なawkスクリプトの内容は次のとおりですadd_param_by_id.awk。

#!/bin/awk -f
BEGIN{ FS=":[[:space:]]+" }
NR==FNR{ a[$1] = $2; next }
match($0, /\<id="([^"]+)"/, b) && b[1] in a{ 
    sub(/\<id="[^"]+"/, "& some_param=\042"a[b[1]]"\042") 
}1

主なコマンド：

export pat="($(cut -d':' -f1 source.yml | paste -s -d'|'))"
grep -ElZr "\<id=\"$pat\"" --include=*.txt | xargs -0 -I{} sh -c \
'awk -f add_param_by_id.awk source.yml "$1" > "/tmp/$$" && mv "/tmp/$$" "$1"' _ {}

pat- 識別子を含む交互に正規表現グループを含む変数。(apples|grapes|trees|strawberry)
grep -ElZr id=\"$pat\" --include=*.txt- 指定された識別子と一致するすべてのファイル名を印刷します。

処理されたサンプルファイルの内容：

This is some plain text
Toreplace string contains id="apples" some_param="Apples are very tasty"
The most vitamin-rich berry is id="strawberry" some_param="Yummy"

Question 2

「ファイル名に奇妙な文字がありません」や「データ値と一致または置換する文字がありません」などの特定の警告が表示される場合は、/この方法が役立ちます。 YAMLファイルの各行にあるすべてのファイルを繰り返すので、それほど効率的ではありませんが、この問題を解決するには、YAMLファイルの相対サイズとターゲットファイルの数に関する追加情報が必要です。

while IFS=: read -r id sp
do
    id="id=\"$id\"" sp="some_param=\"${sp:1}\""

    find . -type f -name '*.txt' |
        while IFS= read -r file
        do
            sed -i "/\<$id/s/$/ $sp/" "$file"
        done
done <source.yml

Answer

「ファイル名に奇妙な文字がありません」や「データ値と一致または置換する文字がありません」などの特定の警告が表示される場合は、/この方法が役立ちます。 YAMLファイルの各行にあるすべてのファイルを繰り返すので、それほど効率的ではありませんが、この問題を解決するには、YAMLファイルの相対サイズとターゲットファイルの数に関する追加情報が必要です。

while IFS=: read -r id sp
do
    id="id=\"$id\"" sp="some_param=\"${sp:1}\""

    find . -type f -name '*.txt' |
        while IFS= read -r file
        do
            sed -i "/\<$id/s/$/ $sp/" "$file"
        done
done <source.yml

SED / AWK：異なるソースファイルの正規表現値と一致する複数のファイルに文字列を追加する

答え1

答え2

関連情報