ISO-IR-87からUTF-8エンコーディングへの変換

ISO-IR-87からUTF-8エンコーディングへの変換

私はDebianとその派生物を研究しています。生の入力ISO-IR-87をUTF-8に変換したいです。簡単な方法がありますか?

参考までに:

% iconv -l | grep "IR-8"
ISO-IR-8-1//
ISO-IR-84//
ISO-IR-85//
ISO-IR-86//
ISO-IR-88//
ISO-IR-89//

% dpkg -S /usr/bin/iconv
libc-bin: /usr/bin/iconv

% apt-cache policy libc-bin
libc-bin:
  Installed: 2.36-9+deb12u3
  Candidate: 2.36-9+deb12u3
  Version table:
 *** 2.36-9+deb12u3 500
        500 http://security.debian.org/debian-security bookworm-security/main amd64 Packages
        100 /var/lib/dpkg/status
     2.36-9+deb12u2 500
        500 http://deb.debian.org/debian bookworm/main amd64 Packages

私のシステムで録音が機能しているようです(@frostschutzに感謝します)。

% echo -n 'ABC' > t.txt
% recode -v UTF-8..JIS_X0208 t.txt
Request: UTF-8..:libiconv:..JIS_X0208
Shrunk to: UTF-8..JIS_X0208
Recoding t.txt... done
% recode -v JIS_X0208..UTF-8 t.txt
Request: JIS_X0208..:libiconv:..UTF-8
Shrunk to: JIS_X0208..UTF-8
Recoding t.txt... done

答え1

GNUはrecodeこれをサポートしているようです:

$記録-l grep-i ISO-IR-87
JIS_X0208 csISO87JISX0208ISO-IR-87JIS0208 JISX0208.1983-0 JISX0208.1990-0 JIS_X0208-1983 JIS_X0208-1990 X0208

だから:

recode ISO-IR-87..UTF-8

他の名前もたくさんあるようです(参照:https://en.wikipedia.org/wiki/JIS_X_0208またはそれ以上)しかし、それらのどれもiconvGNU libcではサポートされていないようです。 Wikipediaの記事では、日本語の文字セットが正しく指定されておらず、インプリメンテーション間の非互換性があり、現在使用されていないことを示唆しています。これは、GNU libcに含まれていない理由を説明しています(GNUのスタンドアロンiconvライブラリに含まれているにもかかわらず、示されているように)。 @)フロストスーツ)。

関連情報