私の最初のファイルには1099個の列があります。
#rnaseq/SNPID hg19Location Gene TCGA-BH-A0C0-01A TCGA-A2-A3XY-01A TCGA-XX-A89A-01A TCGA-B6-A0I2-01A TCGA-LL-A6FP-01A TCGA-EW-
rnaseq - ?|100133144 7.8666 9.6884 22.3240 1.8760 2.0161 7.8383 5.3991 0.0857 4.5513 15.4363 15.0035 4.3578 0.6809 2.5364 12.4086 11.5839
比較したい列は3列から始まります。
TCGA-BH-A0C0-01A TCGA-A2-A3XY-01A TCGA-XX-A89A-01A TCGA-B6-A0I2-01A TCGA-LL-A6FP-01A TCGA-EW-
2番目のファイルには1119個の列があります。
[1]#SNPID hg19Location Gene AlleleA AlleleB dbSNP nSample TCGA-AC-A3TN-01A-11D-A227-01 TCGA-V7-A7HQ-01A-11D-A33D-01 TCGA-BH-A18R-01A-
[2]SNP_A-1780270 chr7:78599583:- MAGI2|ENSG00000187391.13 C G rs987435 2236 1_0.002700 1_0.006000 1_0.000300
比較したい列は8列から始まります。
TCGA-AC-A3TN-01A-11D-A227-01 TCGA-V7-A7HQ-01A-11D-A33D-01 TCGA-BH-A18R-01A-
このように、最初のファイルの列名を2番目のファイルの列名と一致させ、2番目のファイルだけが最初のファイルと同じ列名を持つようにしたいと思います。
だから、基本的に両方のファイルで同じ列名を持ちたいと思います。
答え1
1つのファイルにのみこれを行いますか?また、列はタブやカンマなどの標準で区切られていますか?これが真であれば、最も簡単な方法はLibreOffice Calcでファイルを開き、区切り文字を何か(タブなど)に設定してから、あるファイルから別のファイルに必要な列をコピーすることです。 LibreOfficeでファイルを開くときに区切り文字を設定するように求められない場合は、ファイル名を.csv
firstに変更してください。