複数のISOエンコーディング、つまりISO-8859-6でエンコードされた文字とISO-8859-1でエンコードされた一部の文字(ISO-8859-6にはその文字がないため)を含むアラビア語ファイルがあります。ファイル全体をutf-8に変換したいです。だから私が試したのは、ファイル全体を.txtを使用してISO-8859-1に変換し、iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop
.txtを使用してutf-8に変換することでしたiconv -f ISO-8859-1 -t UTF-8 fileop>finalfile
。しかし、結果はまだUTF-8でエンコードされたアラビア語ではなく、奇妙な文字にすぎません。エンコーディングを統合してUTF-8形式を取得する方法はありますか?それ以外の場合、utf-8システムでは機能しないため、sedを使用せずにISO-8859-1をどのように削除できますか?
複数のISOエンコーディングを含むファイル
関連情報
- ArchLinuxにmdmディスプレイマネージャをインストールする正しい方法
- Centosでapt-getを実行できますか?では、どのように実行できますか?
- libvirt/kvm - ブリッジされたネットワークから仮想マシンのIPアドレスを取得するには?
- 脚注
- シェルのユーティリティ依存関係
- ペパーミントOSはターミナルにドラッグアンドドロップできませんか?
- Arch LinuxのCronjobでコマンドを実行する
- 多数のinodeチェックサムエラーのあるファイルシステムの修復 - Debian 11のext4 64ビット
- Bare Arch Linuxには、アプリケーション用の一時Xサーバーが付属しています。
- "find -print0"出力をgrepする方法は?