列の重複項目を削除し、複数行の値を単一行に線形化します。

Question 1

簡単にアッ:

awk '{ r=$0; sub($1,"",r); a[$1]=(a[$1])? a[$1]"\t"r : r }
     END{ for(i in a) { gsub(/[[:space:]]{2,}/," ",a[i]); print i,a[i] } }' file

r=$0- 記録のコピーをキャプチャします。
sub($1,"",r)- コピーの最初のフィールドを削除して、残りのフィールドをr変数に保存します。
a[$1]=(a[$1])? a[$1]"\t"r : r- 同じ価値を築くグループ(セッション1で提案)
for(i in a)- グループ化されたすべての項目を繰り返します。
gsub(/[[:space:]]{2,}/," ",a[i])- 単語の間に不要なスペースを削除します。
print i,a[i]- グループ名と値の印刷

出力：

DAPPUDRAFT_194440  Phosphorous Temperature 
DAPPUDRAFT_196694  Salinity
DAPPUDRAFT_194512  Fishkairomones Cadmium Zinc Quantumdots
DAPPUDRAFT_194472  Phosphorous Fishkairomones Temperature 
DAPPUDRAFT_196131  Salinity Phosphorous hypoxia 
DAPPUDRAFT_195644  Salinity Phosphorous

Answer

簡単にアッ:

awk '{ r=$0; sub($1,"",r); a[$1]=(a[$1])? a[$1]"\t"r : r }
     END{ for(i in a) { gsub(/[[:space:]]{2,}/," ",a[i]); print i,a[i] } }' file

r=$0- 記録のコピーをキャプチャします。
sub($1,"",r)- コピーの最初のフィールドを削除して、残りのフィールドをr変数に保存します。
a[$1]=(a[$1])? a[$1]"\t"r : r- 同じ価値を築くグループ(セッション1で提案)
for(i in a)- グループ化されたすべての項目を繰り返します。
gsub(/[[:space:]]{2,}/," ",a[i])- 単語の間に不要なスペースを削除します。
print i,a[i]- グループ名と値の印刷

出力：

DAPPUDRAFT_194440  Phosphorous Temperature 
DAPPUDRAFT_196694  Salinity
DAPPUDRAFT_194512  Fishkairomones Cadmium Zinc Quantumdots
DAPPUDRAFT_194472  Phosphorous Fishkairomones Temperature 
DAPPUDRAFT_196131  Salinity Phosphorous hypoxia 
DAPPUDRAFT_195644  Salinity Phosphorous

Question 2

または

$ perl -e 'while(<ARGV>){chomp;($x,$y)=split(/\s+/,$_,2);$hash{$x}.=$y;}for(keys %hash){print "$_ $hash{$_}\n";}' test1
DAPPUDRAFT_196694 Salinity
DAPPUDRAFT_194440 Phosphorous     Temperature
DAPPUDRAFT_195644 Salinity        Phosphorous
DAPPUDRAFT_194472 Phosphorous Fishkairomones  Temperature
DAPPUDRAFT_194512 Fishkairomones      Cadmium Zinc    Quantumdots
DAPPUDRAFT_196131 Salinity        Phosphorous     hypoxia

Answer

または

$ perl -e 'while(<ARGV>){chomp;($x,$y)=split(/\s+/,$_,2);$hash{$x}.=$y;}for(keys %hash){print "$_ $hash{$_}\n";}' test1
DAPPUDRAFT_196694 Salinity
DAPPUDRAFT_194440 Phosphorous     Temperature
DAPPUDRAFT_195644 Salinity        Phosphorous
DAPPUDRAFT_194472 Phosphorous Fishkairomones  Temperature
DAPPUDRAFT_194512 Fishkairomones      Cadmium Zinc    Quantumdots
DAPPUDRAFT_196131 Salinity        Phosphorous     hypoxia

Question 3

行と要素の並べ替え方法に興味がない場合は、次の操作を行います。

sed 'G;s/^\(.*\)\(\t.*\)\n\(.*\)\1/\3\1\2/;h;$!d;s/\n$//' file

GNUでない場合は、文字通りTABにsed置き換えられます。\t

Answer

行と要素の並べ替え方法に興味がない場合は、次の操作を行います。

sed 'G;s/^\(.*\)\(\t.*\)\n\(.*\)\1/\3\1\2/;h;$!d;s/\n$//' file

GNUでない場合は、文字通りTABにsed置き換えられます。\t

列の重複項目を削除し、複数行の値を単一行に線形化します。

答え1

答え2

答え3

関連情報