diffなどのコマンドラインツールを使用して、Linuxで2つのヌクレオチド配列を比較する方法はありますか？

Question

各行を別々のファイルとして保存できます。

f1 - 最初のゲノム配列 f2 - 2番目のゲノム配列

これで、線を（水平から垂直に）変換する必要があります。

awk '{gsub(".","&\n");printf "%s",$0}' < f1 >f1a
awk '{gsub(".","&\n");printf "%s",$0}' < f2 >f2a

これにより、新しい形式が2つの新しいファイル（f1aとf2a）に保存されます。これで、この2つのファイルを次のものと組み合わせます。diff

diff -y f1a f2a  #will output both lines and show differences
diff -c f1a f2a  #will only output the differences and tell you from which line to which line

違いに関する追加情報：http://man7.org/linux/man-pages/man1/diff.1.html

上記は、2つのゲノム配列を変数として渡すことができる小さなスクリプトにすることもできます。

カラー出力が必要な場合はcolordiff（Ubuntuでsudo apt-get install colordiff：）を使用して、以下のスクリプトからに置き換えてくださいdiff。colordiffパラレル出力の場合は、オプションを使用してください-y。

#!/bin/bash
# This script will compare the 2 genomic sequences
echo "1st genomic sequence, followed by [ENTER]:"
read gena
echo "2nd genomic sequence, followed by [ENTER]:"
read genb
echo $gena | awk '{gsub(".","&\n");printf "%s",$0}' > /tmp/fa
echo $genb | awk '{gsub(".","&\n");printf "%s",$0}' > /tmp/fb
echo "Insert the diff argument you wish to use (e.g. -y or -c). Please refer to man diff for information. Hit [ENTER]:"
read $arg
diff $arg /tmp/fa /tmp/fb
exit

Answer 1