1列のテキストのみを考慮して重複行を削除する方法は？

Question 1

awkのフィールド区切り文字を空白に設定するか、クラシック連想配列ベースの重複+排除を実行できます。

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

awkのフィールド区切り文字を空白に設定するか、クラシック連想配列ベースの重複+排除を実行できます。

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 2

質問を誤解したかもしれませんが、これがうまくいくようです。

grep -v '+.' file

出力：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

質問を誤解したかもしれませんが、これがうまくいくようです。

grep -v '+.' file

出力：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 3

私はコマンドを使ってsed同じ目標を達成しました。

sed -n '/^.\{1,5\} .$/p' filename

出力

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Answer

私はコマンドを使ってsed同じ目標を達成しました。

sed -n '/^.\{1,5\} .$/p' filename

出力

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Question 4

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

出力は次のとおりです

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

Answer

mlr --tsv --implicit-csv-header --headerless-csv-output \
    put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile

出力は次のとおりです

ICR1    +
IRT1    +
LSR1    -
NME1    +
PWR1    -
Q0017   -
Q0020   -

関連情報