次のタブで区切られたデータがあります。
データセット | ID | 値 |
---|---|---|
ㅏ | 1 | 10 |
ㅏ | 2 | 20 |
ㅏ | サム | 30 |
第二 | 1 | 40 |
第二 | 2 | 50 |
第二 | サム | 60 |
次のように変換したいと思います。
ID | ㅏ | 第二 |
---|---|---|
1 | 10 | 40 |
2 | 20 | 50 |
サム | 30 | 60 |
私はrとpythonでこれを行う方法を知っていますが、これは〜600の異なるデータセットと〜30,000の異なるIDを含む非常に大きなファイルです。
時間をかけて助けてくれてありがとう。
答え1
それを発見。
datamash crosstab 2,1 unique 3 < input.tsv > output.tsv