‌最初の列をIDに基づいて各グループの最小値を持つ行を選択する方法は？

Question 1

1つの方法は、昇順にソートしてから、各col1の最初のcol2値を記録し、現在のcol2値が等しいかどうかを印刷することです。

sort -k1,1n -k2,2g file | awk '!a[$1] {a[$1] = $2} $2 == a[$1]'
1   7.8e-12
1   7.8e-12
2   9.3e-13
3   3.0e-11
3   3.0e-11

Answer

1つの方法は、昇順にソートしてから、各col1の最初のcol2値を記録し、現在のcol2値が等しいかどうかを印刷することです。

sort -k1,1n -k2,2g file | awk '!a[$1] {a[$1] = $2} $2 == a[$1]'
1   7.8e-12
1   7.8e-12
2   9.3e-13
3   3.0e-11
3   3.0e-11

Question 2

科学的表記法で数字を処理する必要があります。

awk '
    NR == FNR {
        if (!($1 in min) || $2 < min[$1])
            min[$1] = $2
        next
    }
    $2 == min[$1]
' file file

ファイルを2回処理します。一度は各キーの最小値を見つけ、その最小値を持つ行を出力します。

Answer

科学的表記法で数字を処理する必要があります。

awk '
    NR == FNR {
        if (!($1 in min) || $2 < min[$1])
            min[$1] = $2
        next
    }
    $2 == min[$1]
' file file

ファイルを2回処理します。一度は各キーの最小値を見つけ、その最小値を持つ行を出力します。

Question 3

テキスト処理ベースの回答を完了するためにPostgreSQLを使用してこれを行う方法は次のとおりです。

まず、簡単にインポートできるようにファイルを前処理してCSVに変換します。

awk -v OFS=, '$1=$1' file.txt > file.csv

次に、PostgreSQLで次のように一時テーブルを作成します。

create temp table x (id int, bignum float);

CSVをコピーします。

\copy x from file.csv with (format csv)

目的の結果を得るには、一時テーブルに問い合わせてください。

select id, bignum
from (
  select
    *,
    rank() over (partition by id order by bignum)
      as rank
  from x
) as sqlrequiresthisalias
where rank = 1;

結果：

 id | bignum  
----+---------
  1 | 7.8e-12
  1 | 7.8e-12
  2 | 9.3e-13
  3 |   3e-11
  3 |   3e-11
(5 rows)

Answer