bcftoolsを使用して次のデータセットを取得しました。
$ bcftools query -f '%CHROM %POS %REF %ALT %AN %AC \n' fname.vcf
CHROM POS REF ALT AN AC
6 85406127 T A 6 2
6 85406180 T G 6 5
6 85406187 T G 6 1
-
-
-
6 85434019 T A 0 0
6 85434075 A C 0 0
次のコマンドを使用して目的の出力を取得します。
bcftools query -f '%CHROM %POS %REF %ALT %AN %AC \n' fname.vcf | awk '$5 !=0' | awk '{printf "%s:%s %s:%s %f\n", $1, $2, $3, $4,$6/$5}'
6:85406127 T:A 0.333333
6:85406139 T:C 0.000000
6:85406180 T:G 0.833333
データ・セットでは、列 5 と 6 には 0 が含まれます。したがって、0を0で割った結果は次のようになります。致命的:0で除算しようとしました。これが出力の3番目の列でNAを見たい理由です。
6:85406127 T:A 0.333333
6:85406139 T:C NA
6:85406180 T:G 0.833333
私は次のような出力を取得しようとします。
bcftools query -f '%CHROM %POS %REF %ALT %AN %AC \n' fname.vcf | awk '{ if [[ $5!= 0 && $6!=0 ]]
'{printf "%s:%s %s:%s %f\n", $1, $2, $3, $4,$6/$5}'
else
'{printf "%s:%s %s:%s %b\n", $1, $2, $3, $4, 'NA'}'
}'
ところで、私はこのような結果を受けました。
awk: cmd. line:1: { if [[ $5!= 0 && $6!=0 ]]
awk: cmd. line:1: ^ syntax error
awk: cmd. line:1: { if [[ $5!= 0 && $6!=0 ]]
awk: cmd. line:1: ^ syntax error
awk: cmd. line:2: {printf
awk: cmd. line:2: ^ unexpected newline or end of string
この問題をどのように解決できますか?
どんな貢献でも大歓迎です!
答え1
ほぼすべて来ました。これを使用してください:
awk '{ if ($5!= 0 && $6!= 0) {printf "%s:%s %s:%s %f\n", $1, $2, $3, $4,$6/$5} else {printf "%s:%s %s:%s NA\n", $1, $2, $3, $4} }'
「NA」文字列はprintf
文字列自体の一部です。さらに、{ *statemet* }
中に入れたくない'
また、AWKでbash
計算()を混在させないでください[[ ]]
。
AWK構文をすばやく確認できますここ
答え2
必要なのは三項式だけです。
bcf... | awk 'NR>1{printf "%s:%s %s:%s %s\n", $1, $2, $3, $4, ($5 ? $6/$5 : "NA")}'
$6
0
分けないのでそれでないかは関係ありません。
見てください(私が持っていないコマンドをcat file
あなたのコマンドに置き換えてください):bcf...
$ cat file
CHROM POS REF ALT AN AC
6 85406127 T A 6 2
6 85406180 T G 6 5
6 85406187 T G 6 1
6 85434019 T A 0 0
6 85434075 A C 0 0
$ cat file | awk 'NR>1{printf "%s:%s %s:%s %s\n", $1, $2, $3, $4, ($5 ? $6/$5 : "NA")}'
6:85406127 T:A 0.333333
6:85406180 T:G 0.833333
6:85406187 T:G 0.166667
6:85434019 T:A NA
6:85434075 A:C NA