タブをフィールド区切り文字として使用してawk内で並べ替える

Question 1

次のいずれかのオプションを選択します。

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011オクテットはASCIIコードです商標文字/\047一重引用符 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

より多くの内容があります…awkのシェル参照の問題;awkのエスケープシーケンス

Answer

次のいずれかのオプションを選択します。

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011オクテットはASCIIコードです商標文字/\047一重引用符 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

より多くの内容があります…awkのシェル参照の問題;awkのエスケープシーケンス

Question 2

これは正しい一行ではないかもしれませんが、単純でタブを使用する必要はありません... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

これは正しい一行ではないかもしれませんが、単純でタブを使用する必要はありません... :D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

FWIW 以下は、データをソートしますが、最上位のヘッダーを保持する実際の問題を解決した方法です。

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上記の仕組みは、入力データの前に0または1（最初の行は0、他のすべての行は1）を追加して対応する指標を最初にソートしてから、関心のある実際のキーをソートしてから、追加されたキーを再度削除します。です。フィールド。

これは段階的に機能します。

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

FWIW 以下は、データをソートしますが、最上位のヘッダーを保持する実際の問題を解決した方法です。

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上記の仕組みは、入力データの前に0または1（最初の行は0、他のすべての行は1）を追加して対応する指標を最初にソートしてから、関心のある実際のキーをソートしてから、追加されたキーを再度削除します。です。フィールド。

これは段階的に機能します。

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

タブをフィールド区切り文字として使用してawk内で並べ替える

答え1

答え2

答え3

関連情報