西部エンコード（ISO-8859-1）でエンコードされたテキストファイルを読み取るのに問題があります。

Question 1

ポーランド語の標準8ビットエンコーディングは次のとおりです。latin2（別名ISO 8859-2）。 3はł、¿を表します。 żなどを表すテキストは、latin2テキストを表すバイト列をあたかもlatin1を表すかのように解釈した結果です。 ISO 8859-1としても知られているLatin1は、ほとんどの西ヨーロッパ言語の標準エンコーディングです。

テキストがlatin2でエンコードされている場合は、latin1からUTF-8ではなくlatin2からUTF-8に変換する必要があります。

iconv -f latin2 -t utf8

（-t utf8UTF-8ロケールを呼び出すので、これはオプションです。）

テキストを読みながら表示すると、これはある時点で8ビットからUnicodeに正しく変換されなかったことを意味します。これを修正するには、生のバイトに戻してからエンコードに変換します。

iconv -f utf8 -t latin1 | iconv -f latin2 -t utf8

Answer

ポーランド語の標準8ビットエンコーディングは次のとおりです。latin2（別名ISO 8859-2）。 3はł、¿を表します。 żなどを表すテキストは、latin2テキストを表すバイト列をあたかもlatin1を表すかのように解釈した結果です。 ISO 8859-1としても知られているLatin1は、ほとんどの西ヨーロッパ言語の標準エンコーディングです。

テキストがlatin2でエンコードされている場合は、latin1からUTF-8ではなくlatin2からUTF-8に変換する必要があります。

iconv -f latin2 -t utf8

（-t utf8UTF-8ロケールを呼び出すので、これはオプションです。）

テキストを読みながら表示すると、これはある時点で8ビットからUnicodeに正しく変換されなかったことを意味します。これを修正するには、生のバイトに戻してからエンコードに変換します。

iconv -f utf8 -t latin1 | iconv -f latin2 -t utf8

Question 2

解決策を見つけて、同じ問題を抱えている他の人に役立つ可能性があるので、答えをここに残しておきます。

さまざまなエンコーディングを使用してテキストファイルを開く！私（ポーランド人）の場合はCP1250（中央ヨーロッパ）です。これを行うには、geditを開き、「開く」オプションを選択して必要なファイルを見つけます。次に、文字エンコード（左下）を選択し、「WINDOWS-1250」を選択します。

映画の字幕に関連付けられているため、映画の字幕を実行する前に毎回手動でエンコードを変更する必要はありません。ほとんどすべてのビデオプレーヤーには、デフォルトの字幕エンコーディングを選択するオプションがあります。ポーランド語の場合、Windows-1250を選択すると、アプリケーションはそのエンコードでエンコードされているかのように字幕を読み取ります。

とにかくギルスにご協力いただきありがとうございます！

Answer

解決策を見つけて、同じ問題を抱えている他の人に役立つ可能性があるので、答えをここに残しておきます。

さまざまなエンコーディングを使用してテキストファイルを開く！私（ポーランド人）の場合はCP1250（中央ヨーロッパ）です。これを行うには、geditを開き、「開く」オプションを選択して必要なファイルを見つけます。次に、文字エンコード（左下）を選択し、「WINDOWS-1250」を選択します。

映画の字幕に関連付けられているため、映画の字幕を実行する前に毎回手動でエンコードを変更する必要はありません。ほとんどすべてのビデオプレーヤーには、デフォルトの字幕エンコーディングを選択するオプションがあります。ポーランド語の場合、Windows-1250を選択すると、アプリケーションはそのエンコードでエンコードされているかのように字幕を読み取ります。

とにかくギルスにご協力いただきありがとうございます！

西部エンコード（ISO-8859-1）でエンコードされたテキストファイルを読み取るのに問題があります。

答え1

答え2

関連情報