UTF-8でエンコードされた2つのテキストファイルを比較したいです。 Linuxコマンドdiffとcommはこれらのエンコーディングを処理できますか?
答え1
なぜできないの?
2つのロシア語テキストファイル
$ file -i test1.txt test2.txt
test1.txt: text/plain; charset=utf-8
test2.txt: text/plain; charset=utf-8
$ cat test1.txt
Привет
$ cat test2.txt
Добрый день
$ diff test1.txt test2.txt
1c1
< Привет
---
> Добрый день
答え2
使用-私強制ファイルパラメータエンコーディングに関する情報の印刷
いくつかの文字を含む2つのファイルを作成しました。
コードUTF-8そしてコードISO-8859-1
$ file -i *
file1: text/plain; charset=utf-8
file2: text/plain; charset=iso-8859-1