ソースエンコーディングがわからず、テキストファイルエンコーディングの変更

ソースエンコーディングがわからず、テキストファイルエンコーディングの変更

単一のコマンドを使用してUnixでファイルの文字セットエンコーディングを変更したいのですが、これは自動化されたプロセスなので、ソースエンコーディングを知ることはできません。

したがって、すべてのソースエンコーディングのエンコーディングをUTF-8に変更するコマンドが必要です。

答え1

あなたはそれを使用することができますまたは録音ファイルを変換します。ただし、ソースエンコーディングを指定する必要があります。

ソースエンコーディングに関する情報はどこかで入手する必要があります。プレーンテキストファイルにはエンコーディングに関する情報は含まれません。一部の形式のテキストには手順(HTMLやLaTeXのタイトルなど)が含まれていますが、通常はユーザーが自分で判断する必要があります。テキストファイルに使用するエンコーディングを決定することは環境によって異なります。

ソースエンコーディングを推測してみてください。これは、次の場合にのみ機能する可能性が高いです。一部ファイルに関する情報 - ファイルがどの言語であるかを知っているか(たとえば、ポーランド語または英語であることを知っている)、デフォルトのエンコーディングがいくつかあります(例:UTF-8またはLatin-1)。バラよりテキストファイルのエンコーディングをどのようにテストしますか?動作しますか?それは何ですか?そして混合エンコードテキストファイルを再エンコードする方法いくつかの可能性については、以下を含めてください。エンカそしてPerlコーディング::推測。データセットに基づいて、これらのツールのいずれかがあなたに適しているかどうかを判断する必要があります。

関連情報