LinuxコマンドcommはUTF-8でエンコードされたテキストファイルを処理できますか?

LinuxコマンドcommはUTF-8でエンコードされたテキストファイルを処理できますか?

UTF-8でエンコードされた2つのテキストファイルを比較したいです。 Linuxコマンドdiffとcommはこれらのエンコーディングを処理できますか?

答え1

なぜできないの?

2つのロシア語テキストファイル

$ file -i test1.txt test2.txt                                                                                                                                                    
test1.txt: text/plain; charset=utf-8                                                                                                                                                                               
test2.txt: text/plain; charset=utf-8

$ cat test1.txt                                                                                                                                                                  
Привет                     

$ cat test2.txt                                                                                                                                                                  
Добрый день                                                                                                                                                                                                        

$ diff test1.txt test2.txt                                                                                                                                                       
1c1                                                                                                                                                                                                                
< Привет                                                                                                                                                                                                           
---                                                                                                                                                                                                                
> Добрый день                                                                                                                                                                                                      

答え2

使用-私強制ファイルパラメータエンコーディングに関する情報の印刷

いくつかの文字を含む2つのファイルを作成しました。

コードUTF-8そしてコードISO-8859-1

$ file -i *
file1: text/plain; charset=utf-8
file2: text/plain; charset=iso-8859-1

関連情報