ファイル1の特定のパターン位置に基づいて最初の列に基づいて2つのファイルをマージします。

Question 1

file1、file2、および各列の意味を知っている場合は、より良い変数名が表示されます。しかし、すべてのUnixシステムのすべてのシェルでawkを使用するわけではありません。

$ cat tst.awk
BEGIN { tgt = 1402 }
NR == FNR {
    file2[$1] = $0
    next
}
{
    fld = "0000"
    val = "unknown"
    for ( i=2; i<=NF; i++ ) {
        if ( $i == tgt ) {
            fld = $i
            if ( $1 in file2 ) {
                split(file2[$1],f)
                val = f[i]
            }
            break
        }
    }
    print $1, fld, val
}

$ awk -f tst.awk file2 file1
1010089 1402 26
1010121 1402 62
1305789 1402 unknown
3456889 0000 unknown

Answer

file1、file2、および各列の意味を知っている場合は、より良い変数名が表示されます。しかし、すべてのUnixシステムのすべてのシェルでawkを使用するわけではありません。

$ cat tst.awk
BEGIN { tgt = 1402 }
NR == FNR {
    file2[$1] = $0
    next
}
{
    fld = "0000"
    val = "unknown"
    for ( i=2; i<=NF; i++ ) {
        if ( $i == tgt ) {
            fld = $i
            if ( $1 in file2 ) {
                split(file2[$1],f)
                val = f[i]
            }
            break
        }
    }
    print $1, fld, val
}

$ awk -f tst.awk file2 file1
1010089 1402 26
1010121 1402 62
1305789 1402 unknown
3456889 0000 unknown

Question 2

この試み：

  $ awk 'FNR==NR {for (ii=2;ii<=NF;ii++) if ($ii=="1402") a[$1]=ii;next} 
         {if ($1 in a) {column=a[$1]; print $1,"1402",$column}}' file1 file2
   
  1010089 1402 26
  1010121 1402 62

このソリューションは多くのソリューションの1つです。非常に一般的なので、file2最初の列の値が重複しても、約300,000行をすべて処理します。値「1402」は、の最初の列の後の任意の列に配置できますfile1。

ファタイ

Answer

この試み：

  $ awk 'FNR==NR {for (ii=2;ii<=NF;ii++) if ($ii=="1402") a[$1]=ii;next} 
         {if ($1 in a) {column=a[$1]; print $1,"1402",$column}}' file1 file2
   
  1010089 1402 26
  1010121 1402 62

このソリューションは多くのソリューションの1つです。非常に一般的なので、file2最初の列の値が重複しても、約300,000行をすべて処理します。値「1402」は、の最初の列の後の任意の列に配置できますfile1。

ファタイ

ファイル1の特定のパターン位置に基づいて最初の列に基づいて2つのファイルをマージします。

答え1

答え2

関連情報