区切り記号で行を分割

Question 1

$ awk 'split($3,f,/,/)>1{for (i=1; i in f; i++) {$3=f[i]; print} next } 1' file
text1a text2a id1 text4a text5a
text1b text2b id2 text4b text5b
text1c text2c id3 text4c text5c
text1c text2c id4 text4c text5c
text1d text2d id5 text4d,text4di text5d
text1d text2d id6 text4d,text4di text5d
text1d text2d id7 text4d,text4di text5d

上記は、$ 3に記載されているIDの順序を維持します。不要な場合にfor (i in f)置き換えることができますfor (i=1; i in f; i++)。

Split() が 1 より大きい値を返す場合、無条件割り当てを実行するよりも $3 を割り当てるループブロックを実行する方が効率的です。なぜなら、フィールドへの各割り当ては、awkが現在のレコードを書き換えることを強制し、すべてのFSをOFSに置き換えるからです。。

Answer

$ awk 'split($3,f,/,/)>1{for (i=1; i in f; i++) {$3=f[i]; print} next } 1' file
text1a text2a id1 text4a text5a
text1b text2b id2 text4b text5b
text1c text2c id3 text4c text5c
text1c text2c id4 text4c text5c
text1d text2d id5 text4d,text4di text5d
text1d text2d id6 text4d,text4di text5d
text1d text2d id7 text4d,text4di text5d

上記は、$ 3に記載されているIDの順序を維持します。不要な場合にfor (i in f)置き換えることができますfor (i=1; i in f; i++)。

Split() が 1 より大きい値を返す場合、無条件割り当てを実行するよりも $3 を割り当てるループブロックを実行する方が効率的です。なぜなら、フィールドへの各割り当ては、awkが現在のレコードを書き換えることを強制し、すべてのFSをOFSに置き換えるからです。。

Question 2

線が分割される順序は重要ではないため、次のように分割できますawk。

$ awk '{ split($3,a,","); for (i in a) { $3 = a[i]; print } }' file
text1a text2a id1 text4a text5a
text1b text2b id2 text4b text5b
text1c text2c id3 text4c text5c
text1c text2c id4 text4c text5c
text1d text2d id5 text4d,text4di text5d
text1d text2d id6 text4d,text4di text5d
text1d text2d id7 text4d,text4di text5d

各行に対して、3番目のフィールドをコンマに配置して配列を作成しますa。フィールドにカンマがない場合、配列には単一の要素のみを含めることができます。

その後、コードは配列のインデックスを繰り返しa（配列の実装方法に応じて任意の順序で実行できますawk）、3番目のフィールドを配列の現在の要素に設定して変更し、a全体を印刷します。（修正されることがあります）記録。

Answer

線が分割される順序は重要ではないため、次のように分割できますawk。

$ awk '{ split($3,a,","); for (i in a) { $3 = a[i]; print } }' file
text1a text2a id1 text4a text5a
text1b text2b id2 text4b text5b
text1c text2c id3 text4c text5c
text1c text2c id4 text4c text5c
text1d text2d id5 text4d,text4di text5d
text1d text2d id6 text4d,text4di text5d
text1d text2d id7 text4d,text4di text5d

各行に対して、3番目のフィールドをコンマに配置して配列を作成しますa。フィールドにカンマがない場合、配列には単一の要素のみを含めることができます。

その後、コードは配列のインデックスを繰り返しa（配列の実装方法に応じて任意の順序で実行できますawk）、3番目のフィールドを配列の現在の要素に設定して変更し、a全体を印刷します。（修正されることがあります）記録。

Question 3

別のアプローチは次のとおりです。

cat fun.awk

$3~/^id[0-9]+,/ {
    split($3, store, ",");
    for (i = 1; i in  store; i++)
        print $1, $2, store[i], $4, $5

    next
}

{ print $0 }

3番目の列にカンマ（$3~/^id[0-9]+,/）が含まれている場合は、それらを分割し、各列に1行を印刷して次のループに移動します。それ以外の場合は、行全体を印刷します（$0）。

Answer

別のアプローチは次のとおりです。

cat fun.awk

$3~/^id[0-9]+,/ {
    split($3, store, ",");
    for (i = 1; i in  store; i++)
        print $1, $2, store[i], $4, $5

    next
}

{ print $0 }

3番目の列にカンマ（$3~/^id[0-9]+,/）が含まれている場合は、それらを分割し、各列に1行を印刷して次のループに移動します。それ以外の場合は、行全体を印刷します（$0）。

区切り記号で行を分割

答え1

答え2

答え3

関連情報