可能なすべての一致ペアと関連情報

Question 1

perl -MList::MoreUtils=zip -F, -lne '
    next if $. == 1;
    push @lines, [@F];
} END {
    print "id1,id2,info1.1,info1.2,info2.1,info2.2";
    for ($i = 0; $i < @lines - 1; $i++) {
        for ($j = $i+1; $j < @lines; $j++) {
            print join ",", zip @{$lines[$i]}, @{$lines[$j]};
        }
    }
' input.txt

Answer

いくつかのPerl、リスト::追加ユーティリティCPANから：

perl -MList::MoreUtils=zip -F, -lne '
    next if $. == 1;
    push @lines, [@F];
} END {
    print "id1,id2,info1.1,info1.2,info2.1,info2.2";
    for ($i = 0; $i < @lines - 1; $i++) {
        for ($j = $i+1; $j < @lines; $j++) {
            print join ",", zip @{$lines[$i]}, @{$lines[$j]};
        }
    }
' input.txt

Question 2

csvsqlfromを使用してデータベーステーブルを自己結合として実行できます。csvkit:

csvsql --no-inference --query '
  SELECT a.Id AS ID1, b.Id AS ID2, a.info1 AS [info1.1], b.info1 AS [info1.2], a.info2 AS [info2.1], b.info2 AS [info2.2] 
  FROM input a JOIN input b ON a.Id < b.Id
' input.txt
ID1,ID2,info1.1,info1.2,info2.1,info2.2
6,7,7.2,6.6,79.16,78.93
6,8,7.2,6.1,79.16,78.06
7,8,6.6,6.1,78.93,78.06

Answer

csvsqlfromを使用してデータベーステーブルを自己結合として実行できます。csvkit:

csvsql --no-inference --query '
  SELECT a.Id AS ID1, b.Id AS ID2, a.info1 AS [info1.1], b.info1 AS [info1.2], a.info2 AS [info2.1], b.info2 AS [info2.2] 
  FROM input a JOIN input b ON a.Id < b.Id
' input.txt
ID1,ID2,info1.1,info1.2,info2.1,info2.2
6,7,7.2,6.6,79.16,78.93
6,8,7.2,6.1,79.16,78.06
7,8,6.6,6.1,78.93,78.06

Question 3

すべてのUnixシステムのすべてのシェルでawkを使用してください。

$ cat tst.awk
BEGIN { FS=OFS="," }
{ map[NR] = $0 }
END {
    n = split(map[1],a)
    printf "%s%s%s%s", "ID1", OFS, "ID2", (k<n ? OFS : ORS)
    for ( k=2; k<=n; k++ ) {
        printf "%s.1%s%s.2%s", a[k], OFS, a[k], (k<n ? OFS : ORS)
    }
    for ( i=2; i<=NR; i++ ) {
        split(map[i],a)
        for ( j=i+1; j<=NR; j++ ) {
            split(map[j],b)
            for ( k=1; k<=n; k++ ) {
                printf "%s%s%s%s", a[k], OFS, b[k], (k<n ? OFS : ORS)
            }
        }
    }
}

$ awk -f tst.awk input.txt
ID1,ID2,info1.1,info1.2,info2.1,info2.2
6,7,7.2,6.6,79.16,78.93
6,8,7.2,6.1,79.16,78.06
7,8,6.6,6.1,78.93,78.06

Answer

すべてのUnixシステムのすべてのシェルでawkを使用してください。

$ cat tst.awk
BEGIN { FS=OFS="," }
{ map[NR] = $0 }
END {
    n = split(map[1],a)
    printf "%s%s%s%s", "ID1", OFS, "ID2", (k<n ? OFS : ORS)
    for ( k=2; k<=n; k++ ) {
        printf "%s.1%s%s.2%s", a[k], OFS, a[k], (k<n ? OFS : ORS)
    }
    for ( i=2; i<=NR; i++ ) {
        split(map[i],a)
        for ( j=i+1; j<=NR; j++ ) {
            split(map[j],b)
            for ( k=1; k<=n; k++ ) {
                printf "%s%s%s%s", a[k], OFS, b[k], (k<n ? OFS : ORS)
            }
        }
    }
}

$ awk -f tst.awk input.txt
ID1,ID2,info1.1,info1.2,info2.1,info2.2
6,7,7.2,6.6,79.16,78.93
6,8,7.2,6.1,79.16,78.06
7,8,6.6,6.1,78.93,78.06

可能なすべての一致ペアと関連情報

答え1

答え2

答え3

関連情報