pdftexの英国以外の非ASCII非LaTeX文字を見つける方法は？

Question

[\x80-\xFF]128から255までのコードポイントのみが含まれます。ロケール、特に文字エンコーディングによっては、ASCII以外の文字セットでも、そうでない場合もあります。これは8ビットエンコーディングにのみ存在します。（正確に言えば、ASCIIベースの8ビットエンコーディングですが、他のエンコーディングに遭遇する可能性はほとんどありません。）事実上の標準UTF-8を含む、文字が個々のバイトではないロケールでは、非[\x80-\xFF]ASCII文字の小さな部分。

ASCII以外の文字を検索する最も簡単な方法は、Cロケールを強制することです。 C言語環境では、文字はバイトです。シングルバイトロケールを使用すると、いくつかのバージョンのGNU grepをはるかに高速にすることができます。

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

Answer 1

[\x80-\xFF]128から255までのコードポイントのみが含まれます。ロケール、特に文字エンコーディングによっては、ASCII以外の文字セットでも、そうでない場合もあります。これは8ビットエンコーディングにのみ存在します。（正確に言えば、ASCIIベースの8ビットエンコーディングですが、他のエンコーディングに遭遇する可能性はほとんどありません。）事実上の標準UTF-8を含む、文字が個々のバイトではないロケールでは、非[\x80-\xFF]ASCII文字の小さな部分。

ASCII以外の文字を検索する最も簡単な方法は、Cロケールを強制することです。 C言語環境では、文字はバイトです。シングルバイトロケールを使用すると、いくつかのバージョンのGNU grepをはるかに高速にすることができます。

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

pdftexの英国以外の非ASCII非LaTeX文字を見つける方法は？

ツールテストを行いましたが、ギルスの後には利点はありません。回答

私がよく知らないこと

答え1

関連情報