エンコードの問題により、同じファイルのファイル名が異なります。

Question 1

Unixファイルシステムは、ファイル名がバイトで構成されているため、ロケールに依存しない傾向があり、そのバイトがASCIIの範囲外の場合、その意味を決定するのはアプリケーションによって異なります。今日のUnixの慣例は、UTF-8を使用して、いくつかのレガシー環境（主にアジア環境）を除いて、ファイル名やその他すべてをエンコードすることです。一方、Windowsファイルシステムはファイルシステムプロパティにエンコードされている傾向があります。

別の方法でエンコードされたファイル名を使用する必要がある場合は、次のコマンドを使用してそのファイルシステムの翻訳ビューを作成します。ファイルシステム変換。バラより SSHで異なるエンコードされたファイル名を使用する

元のシステムには、latin-1でエンコードされたファイル名があるようです。現在のシステムはUTF-8を使用しており、ålatin-1（）で表されるシングルバイトシーケンスは、として印刷された\345UTF-8の無効なシーケンスです。バックアップ処理のため、ファイル名はUTF-8でエンコードされます。 Samba は設定に従ってファイル名を変換します。ls?

デフォルトのエンコードを使用して元のファイルにアクセスするには、再エンコードされたビューを作成します。

mkdir /original-recoded
convmvfs -o icharset=LATIN1,ocharset=UTF8 /original /original-recoded
diff -r /original-recoded /frombackup

（持ちたい権限と所有権によっては、他のオプションが必要になる場合があります。）

Answer

Unixファイルシステムは、ファイル名がバイトで構成されているため、ロケールに依存しない傾向があり、そのバイトがASCIIの範囲外の場合、その意味を決定するのはアプリケーションによって異なります。今日のUnixの慣例は、UTF-8を使用して、いくつかのレガシー環境（主にアジア環境）を除いて、ファイル名やその他すべてをエンコードすることです。一方、Windowsファイルシステムはファイルシステムプロパティにエンコードされている傾向があります。

別の方法でエンコードされたファイル名を使用する必要がある場合は、次のコマンドを使用してそのファイルシステムの翻訳ビューを作成します。ファイルシステム変換。バラより SSHで異なるエンコードされたファイル名を使用する

元のシステムには、latin-1でエンコードされたファイル名があるようです。現在のシステムはUTF-8を使用しており、ålatin-1（）で表されるシングルバイトシーケンスは、として印刷された\345UTF-8の無効なシーケンスです。バックアップ処理のため、ファイル名はUTF-8でエンコードされます。 Samba は設定に従ってファイル名を変換します。ls?

デフォルトのエンコードを使用して元のファイルにアクセスするには、再エンコードされたビューを作成します。

mkdir /original-recoded
convmvfs -o icharset=LATIN1,ocharset=UTF8 /original /original-recoded
diff -r /original-recoded /frombackup

（持ちたい権限と所有権によっては、他のオプションが必要になる場合があります。）

Question 2

Unix / Linuxでは、ファイル名には'\0'（ASCII NUL）および'/'（スラッシュ、ディレクトリ区切り文字）を除く任意の文字を含めることができます。特に、奇妙なエンコーディングで漢字でファイル名を指定するには、続行してください。横説説や他の命令が見えるかもしれませんが、ls(1)悪いことは起こりません。på以下は、「不明/非ASCII文字」の一般的なショートカットですp?。'?'

両方のファイル名を実行して、od -c次のようにします。例:

ls /the/dir/offending/fi* | od -c

（globは無関係な名前をフィルタリングし、好みに合わせて調整することです）。

出力が異なる場合にのみ心配され始めます。しかし、Svedishの設定を考えると、正しい名前はpåおそらく他の名前は前の設定から残ったLatin-4の名前です。

Answer

Unix / Linuxでは、ファイル名には'\0'（ASCII NUL）および'/'（スラッシュ、ディレクトリ区切り文字）を除く任意の文字を含めることができます。特に、奇妙なエンコーディングで漢字でファイル名を指定するには、続行してください。横説説や他の命令が見えるかもしれませんが、ls(1)悪いことは起こりません。på以下は、「不明/非ASCII文字」の一般的なショートカットですp?。'?'

両方のファイル名を実行して、od -c次のようにします。例:

ls /the/dir/offending/fi* | od -c

（globは無関係な名前をフィルタリングし、好みに合わせて調整することです）。

出力が異なる場合にのみ心配され始めます。しかし、Svedishの設定を考えると、正しい名前はpåおそらく他の名前は前の設定から残ったLatin-4の名前です。

エンコードの問題により、同じファイルのファイル名が異なります。

答え1

答え2

関連情報