geditで無効な文字を検索する方法は?

geditで無効な文字を検索する方法は?

JavaScriptファイルを編集するかどうかを確認します。 geditで開くと、次の警告が表示されます。

開いたファイルに無効な文字が含まれています。このファイルを編集し続けると、文書が破損する可能性があります。別の文字エンコーディングを選択して再試行することもできます。

現在のエンコーディングはUTF-8です。ファイルに100,000行を超えるコードがあるので、間違った文字を検索する簡単な方法はありますか?

答え1

ファイルはUTF-8なので実行できますisutf8。追加ユーティリティパッケージです。無効なバイトの行、文字、およびオフセットを提供します。

次に、xxd、hexdumpなどを使用して分析します。

残念ながら、最初の衝突で停止しました。しかし、再びファイルによって異なります。おそらく1つの無効なバイトです。)

ファイル全体に対して同様の分析を実行できるいくつかのCコードがあります。長い間忘れられたディスクのどこかにあります。必要に応じて参照できます。

そうでなければ、はい、代わりに高速です。それ汚い方法は、フレンドリーな紳士が提案したように、geditとして保存されたコピーを比較することです。@ボーンブランド

関連情報