「diff」または他のコマンドを使用して差分率をどのように取得できますか?

「diff」または他のコマンドを使用して差分率をどのように取得できますか?

数千行の2つのファイルがあります。以下を使用してライン/バイト差率を取得したいと思います。違いWimdivあるいは、特定の違いに関係なく、他のコマンドを使用することもできます。

答え1

diffstatあなたが探しているものに似たツールがあります。

$ diff <file1> <file2> | diffstat

はい

$ diff afpuri.c afpuri1.c | diffstat
 unknown |   53 ++++++++++++++++++++---------------------------------
 1 file changed, 20 insertions(+), 33 deletions(-)

diffこれは、ツリーに複数のファイルを含む出力にも使用できます。

引用する

答え2

私の計算は少し間違っているかもしれませんが、あなたが比率を求めていると信じており、これが比率を生み出すと信じています。

#!/usr/bin/env bash

# File 1 contains 1,2,3,4,5 on new lines
# File 2 contains 1,2,3,4,5,6,7,8,9,10 on new lines.

# Compare differentials side-by-side
diff -y 1 2 > diff

# Print lines to file which do not contain ">" prefix.
sed 's/[ ]/d' diff > MATCHES

# Print lines to file which do contain ">" prefix.
sed '/[>]/!d' diff > DIFFS

# Count lines in file that contains MATCHES between Versions of Files 1,2.
MATCHES=$(wc -l MATCHES | sed 's/[^0-9]*//g')

# Count lines in file that DID NOT MATCH between Version of Files 1,2.
DIFFS=$(wc -l DIFFS | sed 's/[^0-9]*//g')

# Sed here is stripping all but the number of lines in file.

RATIO=$(echo "$MATCHES / $DIFFS" | bc -l)

# To get the ratio, we are echoing the #of_matches and the #of_diffs to
# the bc -l command which will give us a float, if we need it.
echo "You've got:" $RATIO "differential."

# Bytes...
# stat -c%s prints bytes to variable
MATCHES=$(stat -c%s MATCHES)
DIFFS=$(stat -c%s DIFFS)

RATIO_BYTE=$(echo "$MATCHES / $DIFFS" | bc -l)
echo "Let Ratio in Bytes be" $RATIO_BYTE
# Again, we divide the matches by the diffs to reach the "ratio" of
# differences between the files.

関連情報