まず、LC_TIME、LC_NUMERIC、および他のほとんどのLC_ *変数のローカル詳細の関連性を理解できますが、「en_AU」が
UTF-8(およびその他のエンコード)ではなくLC_CTYPEとどのように関連しているかはよくわかりません。 )には以下の十分な定義があります(LC_CTYPEの場合)。コーディング定義によって一貫性がありますか? ...
私が文章を書いて考えてみると、おそらく世界の他の地域では小文字を別の方法で大文字で書いているようです...それではどうすれば処理するのiconv
でしょうか? ...
これiconv
が実際に私がこの行を書き始めた理由のようです。これは、ロケールを要求せずに入力エンコード形式のみを要求するためです。
次のジレンマは、locale LC_CTYPE
出力の行項目が何を参照しているか、および/またはレイアウトを取得するのに最適な場所がどこにあるかです。おそらく、より関連性の高い質問は、この情報は誰とどこで提供されますか? ..
必要ないと確信しています...しかし、驚くべきことに、「スクリプト」、「エンコード」、「ロケール」の絵を埋めるのに役立ちます。奇妙ないったん出たらASCIIワールド。
答え1
すべてのゾーン変数は同じゾーン名を使用するため、ワンクリックで必要なゾーンを指定できますLANG=en_AU.utf8
。推測できるように、国の情報は、たとえばほとんどLC_CTYPE
の言語にありますが、i
トルコ語()にはない場合でも関連しています。しかし、奇跡を期待しないでください。例えば、小文字は大文字と一対一の対応を持っているので、良い大文字バージョンはありません。I
İ
tr_TR.utf8
ß
de_DE.iso8859-1
SS
値とともにキーワード名を表示すると、出力を理解しやすくなります(そうでない場合はlocale -k LC_CTYPE
、たとえば特定のキーワードの値を取得できるように出力形式が設計されています)。キーワードのリストとその意味は、ロケールデータの保存方法と同様に、システムによって異なり、多くの人が興味を持っていないため、Cライブラリのソースコードの外では多くのドキュメントを見つけることができません。これまでに最も有用なロケールコマンドの形式は、利用可能なロケール名をリストすることです。-k
-k
locale ctype-width
locale -a
~のためGNUライブラリ(つまり、組み込まれていないLinux):
- メッセージを除くすべてのロケールデータはに保存されます
/usr/lib/locale/locale-archive
。localedef
/usr/share/i18n
とのデータです/usr/local/share/i18n
。ロケール定義ファイルの形式は/usr/share/i18n/locales
ソースコードにのみ文書化されていると思います。 - 文字セットおよびエンコード定義ファイルの形式は次のとおり
/usr/share/i18n/charmaps
です。POSIX:2001で標準化。これらのファイル(またはGNUライブラリ、)のコンパイル済みバージョン/usr/lib/locale/locale-archive
は次のとおりです。賞 プログラムの作成そしてコマンドライン施設。エンコーディング変換は/usr/lib/gconv/*.so
.Gnu libcマニュアルドキュメントにも依存します。独自のgconvモジュールを書く方法セクションには、「この情報は新しいモジュールを作成するのに十分である必要があります。そうする人は、GNU Cライブラリのソースコードで利用可能なソースコードを調べる必要があります」というテキストが含まれています。 - 各アプリケーションには独自のコレクションがあるため、メッセージカタログは特別に処理されます。メッセージカタログはにあります
/usr/share/locale/*/LC_MESSAGES
。マニュアルにはアプリケーション作成者のための文書。 GNU libcのサポートPOSIXインターフェースcatgets
そしてより強力ですテキストインターフェイスのインポート。
書かれた言語は英語と大きく変わらなくても本当に複雑です。フランス語とドイツ語はü
同じ文字ですか?「テレマ」そして「コレクションウムラウト」、フランスとドイツのプリンタがアクセントを少し異なる高さに組版することは重要ですか?i
(İ
トルコ語)の大文字は何ですか? ASCII(ドイツ語のように)だけがある場合は音訳されますかÖ
?辞書の位置合わせ(スウェーデン語、背面)?これは、ラテンアルファベットで書かれたヨーロッパの言語のいくつかの例です!これO
OE
Ä
Z
Unicodeメーリングリストこれらのトピックの多くの例があり、時には熱い議論があります。