文字はviでは見ることができますが、catでは見ることができません。

Question 1

ファイル形式はリトルエンディアンUTF-16です。 Windows の一部のアプリケーションは既定でこれを行うように見え、これにより多くの移植性の問題が発生します。

viASCII-Nul(数値 0) 値バイトを "^@"(control-At) で表します。実際、vimゼロ値バイトを入力するには、control-shift-@ コードを使用できます。

grepファイルをUTF-16として解釈してから、「2」または「0」などのUnicodeコードポイントを見るのではなく、ACII-Nulバイトを見てください。 GNUのマニュアルページにはgrepUTFを処理するオプションはありません。

catASCII-Nul btyは表示されず、問題の端末エミュレータはそれを表示しますが、使用する端末エミュレータはそれを無視します。cat cl.txt | od -x以上を使用すると、cat cl.txt | xxd出力にASCII-Nulバイトが表示されますcat。ファイルの最初の2バイトに「ffef」や「efff」などの内容が表示される場合、これは常識に反してMicrosoftが制定した「バイト順表示」です。

UTF-16をASCIIまたはUTF-8に翻訳するために何をお勧めするのかわかりませんが、iconv一度も試したことはありません。

Answer

ファイル形式はリトルエンディアンUTF-16です。 Windows の一部のアプリケーションは既定でこれを行うように見え、これにより多くの移植性の問題が発生します。

viASCII-Nul(数値 0) 値バイトを "^@"(control-At) で表します。実際、vimゼロ値バイトを入力するには、control-shift-@ コードを使用できます。

grepファイルをUTF-16として解釈してから、「2」または「0」などのUnicodeコードポイントを見るのではなく、ACII-Nulバイトを見てください。 GNUのマニュアルページにはgrepUTFを処理するオプションはありません。

catASCII-Nul btyは表示されず、問題の端末エミュレータはそれを表示しますが、使用する端末エミュレータはそれを無視します。cat cl.txt | od -x以上を使用すると、cat cl.txt | xxd出力にASCII-Nulバイトが表示されますcat。ファイルの最初の2バイトに「ffef」や「efff」などの内容が表示される場合、これは常識に反してMicrosoftが制定した「バイト順表示」です。

UTF-16をASCIIまたはUTF-8に翻訳するために何をお勧めするのかわかりませんが、iconv一度も試したことはありません。

Question 2

はい、役割をgrep変えてください^@。 cat文字が端末に印刷されているが見えない文字です。これらの文字が見えないとしても、その文字が存在しないという意味ではありません。
あなたの選択/好みは、あなたのニーズに最も適したものが何であるかによって異なります。ただし、これによりviファイルが変更される可能性があることに注意してください。
^@生まれた性格ではない。 Windowsプログラムはこれらの文字を積極的にここに配置します。理由を調べるには、プログラマーに尋ねる必要があります。ほとんどの場合、Windowsプログラムでは文字の幅が16ビットであると仮定しますが、Unixシステムでは文字の幅が8ビットであると仮定します。

Answer

はい、役割をgrep変えてください^@。 cat文字が端末に印刷されているが見えない文字です。これらの文字が見えないとしても、その文字が存在しないという意味ではありません。
あなたの選択/好みは、あなたのニーズに最も適したものが何であるかによって異なります。ただし、これによりviファイルが変更される可能性があることに注意してください。
^@生まれた性格ではない。 Windowsプログラムはこれらの文字を積極的にここに配置します。理由を調べるには、プログラマーに尋ねる必要があります。ほとんどの場合、Windowsプログラムでは文字の幅が16ビットであると仮定しますが、Unixシステムでは文字の幅が8ビットであると仮定します。

Question 3

私はかつて同じ問題を経験しました。

viファイル文字セットについて学びます。

使用する場合

file c1.txt

UTF-8ファイルかISOファイルかを確認できます。

その後、変換ユーティリティを使用して変換できます。

echo file iso-8859-1 is converted to UTF in order to be emailed
iconv -f 'iso-8859-1' -t UTF-8  $MESGFILE >>  $MESGENVIADO

Answer