Linuxのファイルシステム文字エンコーディングに関するいくつかの質問

Question 1

あなたの質問を順番に読んだら、明らかな理由で質問を少し異なって表現しました。

1. LANG / LC_ALL環境に関係なく、ファイル名を保存するために固定文字エンコーディングを使用するようにLinuxファイルシステムを構成できますか？

いいえ、できません。質問で述べたように、UNIXファイル名は一連のバイトです。カーネルはエンコードについて何も知らず、完全にユーザースペース（アプリケーションレベルなど）の概念です。

つまり、カーネルはLANG/について何も知らないので、LC_*これを翻訳することはできません。

2. 同じファイルを別のファイル名で参照することは可能ですか？

同じファイルを参照する複数のディレクトリエントリを持つことができます。ハードリンクまたはシンボリックリンク。

ただし、現在のエンコーディングで無効なファイル名（UTF-8ロケールで作業しているときのGBK文字列）は正しく表示されません（まったく存在しない場合）。

3.ファイルシステムと現在の環境との間の文字エンコーディングを変換するためにカーネルをパッチすることはできますか？

君はパッチできないコアこれを行うには（1を参照）、理論的にはCライブラリ（glibcなど）にパッチを適用してこの変換を実行し、カーネルを呼び出すときは常にファイル名をUTF-8に変換してからカーネルから再変換できます。ファイル名を読み取るときのエンコーディング。

より簡単なアプローチは、オーバーレイファイルシステムを作成することです。ヒューズ、ファイル名をUTF-8に変換し、ファイルシステム要求を別の場所にリダイレクトします。理想的には、このファイルシステムをマウントでき、~/transアクセスすると ~/trans/a/GBK/encoded/pathFUSEファイルシステムが実際にアクセスされます /a/UTF-8/encoded/path。

しかし、これらの方法の問題は、ファイルシステムにすでに存在しているがUTF-8でエンコードされていないファイルをどのように処理するかです。翻訳されていない状態で渡すことはできません。これは変換方法がわからないからです。無効な文字シーケンスを変換して破損することはありません。?衝突が発生する可能性があるためです。

Answer

あなたの質問を順番に読んだら、明らかな理由で質問を少し異なって表現しました。

1. LANG / LC_ALL環境に関係なく、ファイル名を保存するために固定文字エンコーディングを使用するようにLinuxファイルシステムを構成できますか？

いいえ、できません。質問で述べたように、UNIXファイル名は一連のバイトです。カーネルはエンコードについて何も知らず、完全にユーザースペース（アプリケーションレベルなど）の概念です。

つまり、カーネルはLANG/について何も知らないので、LC_*これを翻訳することはできません。

2. 同じファイルを別のファイル名で参照することは可能ですか？

同じファイルを参照する複数のディレクトリエントリを持つことができます。ハードリンクまたはシンボリックリンク。

ただし、現在のエンコーディングで無効なファイル名（UTF-8ロケールで作業しているときのGBK文字列）は正しく表示されません（まったく存在しない場合）。

3.ファイルシステムと現在の環境との間の文字エンコーディングを変換するためにカーネルをパッチすることはできますか？

君はパッチできないコアこれを行うには（1を参照）、理論的にはCライブラリ（glibcなど）にパッチを適用してこの変換を実行し、カーネルを呼び出すときは常にファイル名をUTF-8に変換してからカーネルから再変換できます。ファイル名を読み取るときのエンコーディング。

より簡単なアプローチは、オーバーレイファイルシステムを作成することです。ヒューズ、ファイル名をUTF-8に変換し、ファイルシステム要求を別の場所にリダイレクトします。理想的には、このファイルシステムをマウントでき、~/transアクセスすると ~/trans/a/GBK/encoded/pathFUSEファイルシステムが実際にアクセスされます /a/UTF-8/encoded/path。

しかし、これらの方法の問題は、ファイルシステムにすでに存在しているがUTF-8でエンコードされていないファイルをどのように処理するかです。翻訳されていない状態で渡すことはできません。これは変換方法がわからないからです。無効な文字シーケンスを変換して破損することはありません。?衝突が発生する可能性があるためです。

Question 2

あなたができることは、サポートされているロケールの数をUTF-8ロケールに限定することです。

http://www.fifi.org/cgi-bin/man2html/usr/share/man/man5/locale.gen.5

Answer

あなたができることは、サポートされているロケールの数をUTF-8ロケールに限定することです。

http://www.fifi.org/cgi-bin/man2html/usr/share/man/man5/locale.gen.5

Question 3

バニラunzipとバニラp7zipの両方でOEMコードページの選択が中断されました。私はそうだった斑点この問題を解決し、Ubuntu用ppaこのパッチが適用されたp7zipを使用してください。

Answer

バニラunzipとバニラp7zipの両方でOEMコードページの選択が中断されました。私はそうだった斑点この問題を解決し、Ubuntu用ppaこのパッチが適用されたp7zipを使用してください。

Question 4

zipのこの問題は次のとおりです。安定最近はFar2lファイルとアーカイブマネージャ。 Far2lの以前のzip文字セット検出が正しく機能するためには、システム言語設定は、アーカイブが生成されたシステムで設定された言語設定と一致する必要があります（Windowsの内部「zipフォルダ」ツールは同じロジックを使用します）。あなたもできます。

LANG=zh_CN.UTF-8 far2l

Answer

zipのこの問題は次のとおりです。安定最近はFar2lファイルとアーカイブマネージャ。 Far2lの以前のzip文字セット検出が正しく機能するためには、システム言語設定は、アーカイブが生成されたシステムで設定された言語設定と一致する必要があります（Windowsの内部「zipフォルダ」ツールは同じロジックを使用します）。あなたもできます。

LANG=zh_CN.UTF-8 far2l

Linuxのファイルシステム文字エンコーディングに関するいくつかの質問

答え1

1. LANG / LC_ALL環境に関係なく、ファイル名を保存するために固定文字エンコーディングを使用するようにLinuxファイルシステムを構成できますか？

2. 同じファイルを別のファイル名で参照することは可能ですか？

3.ファイルシステムと現在の環境との間の文字エンコーディングを変換するためにカーネルをパッチすることはできますか？

答え2

答え3

答え4

関連情報