Unixの列名でtxtファイルの列を選択する方法

Question 1

入力区切り文字としてスペース（複数）を想定し、csvcutand csvformatfromを使用します。csvkit

$ csvcut -d' ' -S -c "#CHROM,POS,$(paste -sd, < group1)" group1.data | csvformat -T
#CHROM  POS P0431   P434    P435
Chr01   180349  G   N   G
Chr01   180372  N   N   A
Chr01   180389  A   N   N

Answer

入力区切り文字としてスペース（複数）を想定し、csvcutand csvformatfromを使用します。csvkit

$ csvcut -d' ' -S -c "#CHROM,POS,$(paste -sd, < group1)" group1.data | csvformat -T
#CHROM  POS P0431   P434    P435
Chr01   180349  G   N   G
Chr01   180372  N   N   A
Chr01   180389  A   N   N

Question 2

$ cat tst.awk
NR==FNR {
    groups[++numGroups] = $1
    next
}
FNR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{
    printf "%s%s%s%s", $1, OFS, $2, OFS
    for (groupNr=1; groupNr<=numGroups; groupNr++) {
        group = groups[groupNr]
        printf "%s%s", $(f[group]), (groupNr<numGroups ? OFS : ORS)
    }
}

$ awk -f tst.awk group1 file
#CHROM POS P0431 P434 P435
Chr01 180349 G N G
Chr01 180372 N N A
Chr01 180389 A N N

出力をスペース区切りではなくタブ区切りとして指定するには、スクリプトの上部に行を追加しますBEGIN { OFS="\t" }。

出力を視覚的に表形式で表示するには、printfawkでsを使用するか、上記を次のようにパイプしますcolumn。

$ awk -f tst.awk group1 file | column -t
#CHROM  POS     P0431  P434  P435
Chr01   180349  G      N     G
Chr01   180372  N      N     A
Chr01   180389  A      N     N

Answer

$ cat tst.awk
NR==FNR {
    groups[++numGroups] = $1
    next
}
FNR==1 {
    for (i=1; i<=NF; i++) {
        f[$i] = i
    }
}
{
    printf "%s%s%s%s", $1, OFS, $2, OFS
    for (groupNr=1; groupNr<=numGroups; groupNr++) {
        group = groups[groupNr]
        printf "%s%s", $(f[group]), (groupNr<numGroups ? OFS : ORS)
    }
}

$ awk -f tst.awk group1 file
#CHROM POS P0431 P434 P435
Chr01 180349 G N G
Chr01 180372 N N A
Chr01 180389 A N N

出力をスペース区切りではなくタブ区切りとして指定するには、スクリプトの上部に行を追加しますBEGIN { OFS="\t" }。

出力を視覚的に表形式で表示するには、printfawkでsを使用するか、上記を次のようにパイプしますcolumn。

$ awk -f tst.awk group1 file | column -t
#CHROM  POS     P0431  P434  P435
Chr01   180349  G      N     G
Chr01   180372  N      N     A
Chr01   180389  A      N     N

Question 3

あなたはこれを行うことができますawk：

awk 'NR==1,NR==4 {print $1,$2,$3,$6,$7}' group1 > group1.data

これにより、フィールド1、2、3、6、7の最初の4行だけが印刷され、要求された出力が提供され、ファイルに追加されますgroup1.data。

#CHROM POS P0431 P434 P435
Chr01 180349 G N G
Chr01 180372 N N A
Chr01 180389 A N N

よりきれいに見えるようにするには、OFS='\t'次のように区切り記号をタブに設定できます。

awk 'NR==1,NR==4 {print $1,$2,$3,$4,$5}' OFS='\t' group1 > group1.data

出力：

#CHROM  POS     P0431   P434    P435
Chr01   180349  G       N       G
Chr01   180372  N       N       A
Chr01   180389  A       N       N

私は複数のスペース区切り文字、タブ、および2つの組み合わせを使用してテストし、毎回これらの出力を受け取りました。

Answer

あなたはこれを行うことができますawk：

awk 'NR==1,NR==4 {print $1,$2,$3,$6,$7}' group1 > group1.data

これにより、フィールド1、2、3、6、7の最初の4行だけが印刷され、要求された出力が提供され、ファイルに追加されますgroup1.data。

#CHROM POS P0431 P434 P435
Chr01 180349 G N G
Chr01 180372 N N A
Chr01 180389 A N N

よりきれいに見えるようにするには、OFS='\t'次のように区切り記号をタブに設定できます。

awk 'NR==1,NR==4 {print $1,$2,$3,$4,$5}' OFS='\t' group1 > group1.data

出力：

#CHROM  POS     P0431   P434    P435
Chr01   180349  G       N       G
Chr01   180372  N       N       A
Chr01   180389  A       N       N

私は複数のスペース区切り文字、タブ、および2つの組み合わせを使用してテストし、毎回これらの出力を受け取りました。

Unixの列名でtxtファイルの列を選択する方法

答え1

答え2

答え3

関連情報