行と列のデータ行列にファイルをインポートする

Question 1

mlr --tsv cut -o -f id4,id1,count2 then reshape -s id1,count2 input.tsv

あなたはやる

id4     S1001   S1002   S1003   S1004
ARHGAP18        1483    5353    330     970
ARHGAP12        3698    14      2263    816
ARHGAP15        93      5381    3147    4981
ARHGAP17        1889    105     50      816
ARHGAP19        596     5764    1595    4981

TSVファイルを入出力に設定しました。テキストファイルはタブで区切られていますか？

いくつかのコメント：

--tsv入出力形式を設定することです。
cutid4、id1、count2のみを抽出します。
reshape構造を修正することです。

Answer

Millerで使用形状の変更

mlr --tsv cut -o -f id4,id1,count2 then reshape -s id1,count2 input.tsv

あなたはやる

id4     S1001   S1002   S1003   S1004
ARHGAP18        1483    5353    330     970
ARHGAP12        3698    14      2263    816
ARHGAP15        93      5381    3147    4981
ARHGAP17        1889    105     50      816
ARHGAP19        596     5764    1595    4981

TSVファイルを入出力に設定しました。テキストファイルはタブで区切られていますか？

いくつかのコメント：

--tsv入出力形式を設定することです。
cutid4、id1、count2のみを抽出します。
reshape構造を修正することです。

Question 2

あなたが要求した交差表（またはピボットテーブル）。これを使用して達成できます。GNUデータの混合

datamash --header-in --whitespace crosstab id4,id1 unique count2 < file
    S1001   S1002   S1003   S1004
ARHGAP12    3698    14  2263    816
ARHGAP15    93  5381    3147    4981
ARHGAP17    1889    105 50  816
ARHGAP18    1483    5353    330 970
ARHGAP19    596 5764    1595    4981

--whitespace（データがタブで区切られている場合はスキップできます。）

ただし、作業に適した専用のバイオインフォマティクスツールがあるかもしれません。

Answer

あなたが要求した交差表（またはピボットテーブル）。これを使用して達成できます。GNUデータの混合

datamash --header-in --whitespace crosstab id4,id1 unique count2 < file
    S1001   S1002   S1003   S1004
ARHGAP12    3698    14  2263    816
ARHGAP15    93  5381    3147    4981
ARHGAP17    1889    105 50  816
ARHGAP18    1483    5353    330 970
ARHGAP19    596 5764    1595    4981

--whitespace（データがタブで区切られている場合はスキップできます。）

ただし、作業に適した専用のバイオインフォマティクスツールがあるかもしれません。

行と列のデータ行列にファイルをインポートする

答え1

答え2

関連情報