相関行列の各行を別々のファイルに分割する

Question 1

遺伝子名が最初の列にあると仮定すると、必要なものは次のとおりです。

awk '{print >> $1".txt"; close(n".txt")}' matrix.txt

これにより、行の最初のフィールドに拡張子（完全にオプション）が付いたファイルに各行が印刷されます.txt。ファイルに遺伝子名を含めない場合は、次のようにします。

awk '{n=$1; $1="";print >> n".txt"; close(n".txt")}' matrix.txt

最初の行がヘッダーの場合は、次を使用してください。

awk 'NR>1{print >> $1".txt"; close($1".txt")}' matrix.txt

最後に、最初のフィールドが単純な遺伝子名ではなく、NULLまたは有効なパスを含む可能性があるため、ファイルに行を含めることができるため、入力を削除する必要がある場合は、次のようにします。

awk 'NR > 1 && ($1 ~ /^[A-Z0-9-]+$/) { print >> $1; close($1) }'

Answer

遺伝子名が最初の列にあると仮定すると、必要なものは次のとおりです。

awk '{print >> $1".txt"; close(n".txt")}' matrix.txt

これにより、行の最初のフィールドに拡張子（完全にオプション）が付いたファイルに各行が印刷されます.txt。ファイルに遺伝子名を含めない場合は、次のようにします。

awk '{n=$1; $1="";print >> n".txt"; close(n".txt")}' matrix.txt

最初の行がヘッダーの場合は、次を使用してください。

awk 'NR>1{print >> $1".txt"; close($1".txt")}' matrix.txt

最後に、最初のフィールドが単純な遺伝子名ではなく、NULLまたは有効なパスを含む可能性があるため、ファイルに行を含めることができるため、入力を削除する必要がある場合は、次のようにします。

awk 'NR > 1 && ($1 ~ /^[A-Z0-9-]+$/) { print >> $1; close($1) }'

Question 2

各ファイルに含める内容の例を提供していないか、ファイル名を何で指定するかを推測しているからです。

これは現在のディレクトリから「DATA」ファイルをインポートし、各行の最初の列名にちなんで同じディレクトリに新しいファイルを作成し、そのファイルを残りの列のデータで埋めます。

重要性

IGHD2-15 1   0.696084    0.799736    0.818788

というファイルを作ってIGHD2-15入れてください。

1   0.696084    0.799736    0.818788

スクリプト：

#!/bin/bash

while read -r line; do
        newFileName="$(echo "$line" | awk '{print $1}')"
        newFileData="$(echo "$line" | awk '{$1 = ""; print $0}')"
        echo $newFileData > $newFileName
done < DATA

Answer