データベースの非常に大きな.txtファイルと一致し、そのSNPと一致するテキストファイルからいくつかの列と行を抽出して新しいテキストファイルとして印刷する必要がある約164のSNPのリストがあります。
答え1
データ型に関するいくつかの詳細が役に立ちます。詳細がない場合は、次のようないくつかの前提が必要です。
- SNP は一部のファイルで 1 行に 1 つずつリストされます。
- データ行はスペースで区切られます。
- 行のどこにでも表示されるSNPは、行の一致基準に一致します。
- 一致する各行の列 1、2、3 が必要です。
この場合は、次のことを試してください。
grep -f list_of_SNPs.txt very_large.txt | cut -f 1,2,3 > new_file.txt