awk列で1つ以上の一致を繰り返します。

Question 1

GNU awkを使用するFPAT（すでにgawkが必要なので、gensub()略語\sも使用[[:space:]]）：

$ cat tst.awk
BEGIN {
    FPAT = "([^,]*)|(\"[^\"]+\")"
    OFS=","
}
{
    name = gensub(/^"|"$/,"","g",$1)
    n = split(gensub(/^"|"$/,"","g",$2),emails,/\s*[;,|:]\s*/)
    for (i=1; i<=n; i++) {
        print name, emails[i]
    }
}
$
$ awk -f tst.awk file
agrippa,[email protected]
elvirka,[email protected]
Inofs,[email protected]
Inofs,[email protected]
bekbz,[email protected]
bekbz,[email protected]
njkzif,[email protected]
njkzif,[email protected]
njycz,[email protected]
njycz,[email protected]
DanielEdict,[email protected]
JosEmbesy,[email protected]
JosEmbesy,[email protected]
Walterdon,[email protected]
Walterdon,[email protected]
Kennethlob,[email protected]
Ninosh,[email protected]
Patrickbam,[email protected]

FWIW私は通常、この*sub(/^"|"$/,"",...)方法を使用してCSVフィールドから可能な先行/訓練二重引用符を削除します。substr()二重引用符なしでフィールドを分割しない方法に比べて利点があるためです。

[;,|:]電子メールアドレスが破損しているか、または処理を忘れたもの（たとえば、の区切り文字）に備えて、いくつかのエラー検出を追加することもできます。

$ cat tst.awk
BEGIN {
    FPAT = "([^,]*)|(\"[^\"]+\")"
    OFS=","
}
{
    name = gensub(/^"|"$/,"","g",$1)
    n = split(gensub(/^"|"$/,"","g",$2),emails,/\s*[;,|:]\s*/)
    for (i=1; i<=n; i++) {
        email = emails[i]
        if ( gsub(/@/,"&",email) != 1 ) {
            printf "ERROR: too few or too many email addresses in \"%s\"\n", email | "cat>&2"
            exit 1
        }
        print name, email
    }
}

本当に電子メールアドレスを確認したい場合は、FWIW過去5年間に問題がなく、この正規表現の修正版を使用してきたことを知っています。http://www.regular-expressions.info/email.html（私は特に[：alpha：]の代わりに[a-zA-Z]を使用しました。なぜなら私は私のロケールでそのように見なされる文字だけを許可したいからです。アプリケーションに適した文字を決定するのはあなたの役割です）。

    (email ~ /^[0-9a-zA-Z._%+-]+@[0-9a-zA-Z.-]+\.[a-zA-Z]{2,}$/)

Answer

GNU awkを使用するFPAT（すでにgawkが必要なので、gensub()略語\sも使用[[:space:]]）：

$ cat tst.awk
BEGIN {
    FPAT = "([^,]*)|(\"[^\"]+\")"
    OFS=","
}
{
    name = gensub(/^"|"$/,"","g",$1)
    n = split(gensub(/^"|"$/,"","g",$2),emails,/\s*[;,|:]\s*/)
    for (i=1; i<=n; i++) {
        print name, emails[i]
    }
}
$
$ awk -f tst.awk file
agrippa,[email protected]
elvirka,[email protected]
Inofs,[email protected]
Inofs,[email protected]
bekbz,[email protected]
bekbz,[email protected]
njkzif,[email protected]
njkzif,[email protected]
njycz,[email protected]
njycz,[email protected]
DanielEdict,[email protected]
JosEmbesy,[email protected]
JosEmbesy,[email protected]
Walterdon,[email protected]
Walterdon,[email protected]
Kennethlob,[email protected]
Ninosh,[email protected]
Patrickbam,[email protected]

FWIW私は通常、この*sub(/^"|"$/,"",...)方法を使用してCSVフィールドから可能な先行/訓練二重引用符を削除します。substr()二重引用符なしでフィールドを分割しない方法に比べて利点があるためです。

[;,|:]電子メールアドレスが破損しているか、または処理を忘れたもの（たとえば、の区切り文字）に備えて、いくつかのエラー検出を追加することもできます。

$ cat tst.awk
BEGIN {
    FPAT = "([^,]*)|(\"[^\"]+\")"
    OFS=","
}
{
    name = gensub(/^"|"$/,"","g",$1)
    n = split(gensub(/^"|"$/,"","g",$2),emails,/\s*[;,|:]\s*/)
    for (i=1; i<=n; i++) {
        email = emails[i]
        if ( gsub(/@/,"&",email) != 1 ) {
            printf "ERROR: too few or too many email addresses in \"%s\"\n", email | "cat>&2"
            exit 1
        }
        print name, email
    }
}

本当に電子メールアドレスを確認したい場合は、FWIW過去5年間に問題がなく、この正規表現の修正版を使用してきたことを知っています。http://www.regular-expressions.info/email.html（私は特に[：alpha：]の代わりに[a-zA-Z]を使用しました。なぜなら私は私のロケールでそのように見なされる文字だけを許可したいからです。アプリケーションに適した文字を決定するのはあなたの役割です）。

    (email ~ /^[0-9a-zA-Z._%+-]+@[0-9a-zA-Z.-]+\.[a-zA-Z]{2,}$/)

Question 2

15以上の列と7列の括弧内の説明はよくわかりませんが、与えられた例では次のことを試してみてください。

awk -F, '


        {gsub (/[" ]/,_)                        # remove double quotes and space all over
         D1 = $1                                # save field 1 and
         sub ($1 FS, _)                         # remove it from line
         n  = split ($0, T, /[,;:\|]/)          # split the residual line into array T
         for (i=1; i<=n; i++) print D1, T[i]    # print former $1, and each T element
        }
' OFS=, file
agrippa,[email protected]
elvirka,[email protected]
Inofs,[email protected]
Inofs,[email protected]
.
.
.
Patrickbam,[email protected]

Answer

15以上の列と7列の括弧内の説明はよくわかりませんが、与えられた例では次のことを試してみてください。

awk -F, '


        {gsub (/[" ]/,_)                        # remove double quotes and space all over
         D1 = $1                                # save field 1 and
         sub ($1 FS, _)                         # remove it from line
         n  = split ($0, T, /[,;:\|]/)          # split the residual line into array T
         for (i=1; i<=n; i++) print D1, T[i]    # print former $1, and each T element
        }
' OFS=, file
agrippa,[email protected]
elvirka,[email protected]
Inofs,[email protected]
Inofs,[email protected]
.
.
.
Patrickbam,[email protected]

awk列で1つ以上の一致を繰り返します。

答え1

答え2

関連情報