文字2号 71865 72972 YBL081W。 + SGD遺伝子。 ID=YBL081W;名前=YBL081W;Ontology_term=GO:0003674,GO:0005575,GO:0008150;参考=非必須%20タンパク質%20of%20不明%20機能%3B%20null%20突然20in%20a%20減少% 20in%20plasma%20membrane%20electronic%20transport;dbxref=SGD:S000000177;orf_classification=非特性化
私はgff形式の多くの遺伝データを含むベッドファイルを持っています。最初の列のchrIIからchrなど、最初の列から最初の3文字を削除する必要があり、ローマ数字のみが必要です。
こんな出力を見たい
2号 71865 72972 YBL081W。 + SGD遺伝子。 ID=YBL081W;名前=YBL081W;Ontology_term=GO:0003674,GO:0005575,GO:0008150;参考=非必須%20タンパク質%20of%20不明%20機能%3B%20null%20突然20in%20a%20減少% 20in%20plasma%20membrane%20electronic%20transport;dbxref=SGD:S000000177;orf_classification=非特性化
答え1
このコマンドは、各行の文字4〜500を印刷してfile.gff
最初の3文字を削除し、結果を次の場所に保存しますnewfile.gff
。
cut -c4-500 file.gff > newfile.gff
行の長さが500文字を超える場合は、それに応じて制限を増やしてください。