特定の列の単語セットに基づいた行のフィルタリング

Question 1

GNUを使用すると、awk次のgensubすべての単語を削除し、空白の場合は印刷に使用できます。

awk -F , -v OFS=, 'gensub(/last|lst|name|nm|[0-9_-]*/,"","g",tolower($1))=="" {
    $2="found";
    print $1, $2
}' file

sub/とは異なり、gsub元のgensubレコードを変更せずにそのままにして結果文字列を返します。awkフィールドを変数にコピーして、標準にも同じアプローチを使用できます。

より多くの文字を含めるには（たとえば）[0-9_-]を使用できます。[^[:alpha:]]anything that isn't a letter

last|lst|name|nm|[^[:alpha:]]

Answer

GNUを使用すると、awk次のgensubすべての単語を削除し、空白の場合は印刷に使用できます。

awk -F , -v OFS=, 'gensub(/last|lst|name|nm|[0-9_-]*/,"","g",tolower($1))=="" {
    $2="found";
    print $1, $2
}' file

sub/とは異なり、gsub元のgensubレコードを変更せずにそのままにして結果文字列を返します。awkフィールドを変数にコピーして、標準にも同じアプローチを使用できます。

より多くの文字を含めるには（たとえば）[0-9_-]を使用できます。[^[:alpha:]]anything that isn't a letter

last|lst|name|nm|[^[:alpha:]]

Question 2

この試み、

awk -F, -v OFS=, '
{
split($1,w,/[^[:alnum:]]/);
for (i in w) {
    if (!(match(tolower(w[i]),/\<([0-9]*|last|nm|name|lastnm|lastname)\>/))) next;
}
$2="Found"; print; 
}' file

出力：

LastNm,Found
last_nm,Found
4-LastNm,Found

説明する：

splitフィールドは、単語リストを取得するために英数字ではなくすべての$1文字[^.]（）で構成されています。[:alnum:]
for単語を繰り返します。
言葉があればいいえ許可された単語を含む指定された正規表現を一致させ、nextレコードに移動します。
そのようなことが起こらない場合は、最終的に割り当てて記録する$2="Found"ことprintができます。

Answer

この試み、

awk -F, -v OFS=, '
{
split($1,w,/[^[:alnum:]]/);
for (i in w) {
    if (!(match(tolower(w[i]),/\<([0-9]*|last|nm|name|lastnm|lastname)\>/))) next;
}
$2="Found"; print; 
}' file

出力：

LastNm,Found
last_nm,Found
4-LastNm,Found

説明する：

splitフィールドは、単語リストを取得するために英数字ではなくすべての$1文字[^.]（）で構成されています。[:alnum:]
for単語を繰り返します。
言葉があればいいえ許可された単語を含む指定された正規表現を一致させ、nextレコードに移動します。
そのようなことが起こらない場合は、最終的に割り当てて記録する$2="Found"ことprintができます。

特定の列の単語セットに基づいた行のフィルタリング

答え1

答え2

関連情報