Windowsからコピーした簡体字中国語文字エンコーディングを含むディスクがあります。
今centos7をインストールし、繁体字中国語のエンコーディングを使用しています。
1 このディスクをどのようにマウントしますか?
ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK コマンドを使用しましたが、まだファイル名が混乱しています。
2 このファイルをコピーする方法は?
cp -rコマンドを使用して印刷します。
cp -r /mnt/7 /home/jl/file/7 cp: '/mnt/7/20140206/\275̰\270/\261\270\277\316' にアクセスできません: 適用できないか不完全マルチビットタプル文字またはワイド文字 cp: '/mnt/7/20140206/\275̰\270/֪ʶ\265\343' にアクセスできません: 不適切または不完全なマルチバイト文字またはワイド文字 cp: '/mnt/ 7/20140206にアクセスできません。 /\277τ\274\273':適用できない、または不完全なマルチバイト文字またはワイド文字
おそらく文を読んでいないのに、不適切な文字(?)のためにcpを実行できないという意味です。
この問題は、オペレーティングシステムのさまざまなパス区切り文字のために発生するようです。
私はconvmv -f gbk -t big5 -r --notest /home/jl/file/7を試しましたが、それも失敗しました。
このディレクトリをコピーするにはscpを使用する必要がありますか?
答え1
まず、別のエンコーディングプロトコルであるWindowsエンコーディングを扱っています。UTF-16、Linux、OSXのデフォルト値は次のとおりです。UTF-8。
したがって、エンコーディングを次のように設定しましたが、UTF-8Linuxにデータヒープをインストールすると、データは次のようにエンコードされます。UTF-16Windows経由。
ファイル名にUTF-8で正しく読み取れないマルチバイト文字が含まれているようです。一般に、バイリンガルを話す従業員と作業するときは、この問題を回避するために、ファイル名にUTF-8のアクセントのない文字(最初の128文字)に従うように指示します。
ファイル名の文字エンコーディングの違いにより、TARバックアップを別のエンコーディングを使用しているシステムに復元すると問題が発生する可能性があります。
とにかくICUを使用してエンコードを変換できます。http://site.icu-project.org/。
HTHあなたのアウト -