unicode

Fontawesomeアイコンが正しく貼り付けられていません。
unicode

Fontawesomeアイコンが正しく貼り付けられていません。

私はFedoraを使用していますsudo dnf install fontawesome fonts。後で動作しなかったので、Githubページからzipをダウンロードし、次の手順に従ってフォントを手動でインストールしました。このガイドライン。 「グリフをコピー」を介してアイコンをコピーする場合(例:Firefoxアイコン)このウェブサイトその後、VimまたはEmacsに貼り付けると、Firefoxロゴの代わりにチェックマークが表示されます。たとえば、Unicode挿入を使用して挿入すると同じことが発生しますctr+v u+e007。 他のアイコンにも同...

Admin

xterm(または実際にはX)でUTF-8を無効にする方法は?
unicode

xterm(または実際にはX)でUTF-8を無効にする方法は?

私はDebianを実行する不安定なシステムを持っており、xtermsでUTF-8を使用したくありません(またはまったくありません)。しかし、最近、xtermsと別のウィンドウにUTF-8があることを発見しました。おそらく私が最後の更新(2月24日)したときにそうだったようですが、一週間ほど前までは気づいていませんでした。 私の問題は、スウェーデン語で「å」、「ä」、「ö」などの特殊文字を使用するときです。 新しいxterm開始特殊文字を選択して貼り付けることができますが、別のxtermから特殊文字を貼り付けるとすぐに、たとえば「å」の代わりに「Á\」が表示さ...

Admin

ls:単一列対複数列レイアウト、ファイル名の非Unicode文字
unicode

ls:単一列対複数列レイアウト、ファイル名の非Unicode文字

ファイルを含むディレクトリを作成します~/test。abcdefghijklmnopqrstuvwxyzzyxwvutsrqponmlkjihgfedcba ls ~/test複数列のレイアウトを使用して一覧表示されます。 abcdefghijklmnopqrstuvwxyz zyxwvutsrqponmlkjihgfedcba 各ファイル名の長さは26文字です。 lsただし、キリル文字を使用する場合、複数列レイアウトを使用するファイル名の最大長は17文字に制限されます。ファイル名が長い場合は、単一列レイアウトが使用されます。どこかに文書化されていますか...

Admin

結合されたUnicode文字の検索と置換
unicode

結合されたUnicode文字の検索と置換

äディレクトリ名とファイル名にいくつかの「特殊」文字(、、、ö)üが含まれているDebianシステムには深いフォルダ構造があります。ただし、これは「ISO-8859-1」ではなく、Unicode結合文字の形です。私が知っている限り、a 2つの点(分音符/ウムラウト)を「別の」文字として追加するのは簡単な問題です。 findとsedを使用して、すべてのファイルとフォルダの名前を一括変更してみました。 #!/bin/bash # Files - normal characters find . -depth -name "*[äöüÄÖÜ]*" -exec b...

Admin

「ls name」と「ls | 「grep name」のアクセントが異なります。
unicode

「ls name」と「ls | 「grep name」のアクセントが異なります。

私はXigmanas(NAS freebsd)を使用しています。状況をできるだけ簡単に説明します。 :; set | egrep 'LC_A|LANG' GDM_LANG=fr_FR.UTF-8 LANG=fr_FR.UTF-8 LC_ALL=fr_FR.UTF-8 SLIM_LANG=fr_FR.UTF-8 :; ls -i 1989* ; ls -i | grep 1989 ; ls -ib 1989* ; ls -ib | grep 1989 9920 1989 Amn??sia.mp4 9920 1989 Amnésia.mp4 992...

Admin

端末:UTF-8テキストの動作を理解するのに役立ちます。
unicode

端末:UTF-8テキストの動作を理解するのに役立ちます。

私はUbuntuシステムで観察される次の動作を理解しようとしています。次の2つのファイルを考えてみましょう。 $ hexdump -C 1.txt 00000000 d9 82 d8 a8 d8 a7 d9 86 d9 8a 5e d9 84 d9 86 d8 |..........^.....| 00000010 b2 d8 a7 d8 b1 5d 31 |.....]1| 00000017 そして $ hexdump -C 2.txt 00000000 d9 82 d8 a8 d8 a...

Admin

XQuartz xterm UTF-8リソース名
unicode

XQuartz xterm UTF-8リソース名

次のようにUTF-8リソース名を使用しています。 wengé*Background: #321 wengé*Foreground: #ffb これは、XQuartxメニューと同様に、直接コールを介してXQuartz 2.8.1で機能します。 xterm -name wengé XQuartz 2.8.5にアップグレードした後、もう機能しません。デフォルトのカラーリソースが使用されますが、奇妙なことに、ウィンドウのタイトルxterm に正しいUTF-8名が表示されます。このアップグレード中にシステムシェルがから/bin/bash切り替わ...

Admin

十字マーク(\u274c)がDebian 12では機能しません
unicode

十字マーク(\u274c)がDebian 12では機能しません

Ubuntu 22.04からDebian 12に移行し、コマンドが失敗した場合は十字マークを出力し、コマンドが成功するとチェックマークを出力するbash機能があります。チェックマークは機能しますが、十字マークは機能しません。 出力は次のとおりですlocale。 $ locale LANG=en_US.UTF-8 LANGUAGE=en.UTF-8 LC_CTYPE="C.UTF-8" LC_NUMERIC="C.UTF-8" LC_TIME="C.UTF-8" LC_COLLATE="C.UTF-8" LC_MONETARY="C.UTF-8" LC_ME...

Admin

端末をUnicodeモードに設定するには?
unicode

端末をUnicodeモードに設定するには?

ローカルでログインすると、X11が起動せず、Unicode文字が正しく表示されないDebianサーバーがあります。 Unicode は実行後unicode_start(ターミナルが閉じるまで)動作します。また、SSHを介してログインすると自動的に機能します(おそらく私はサーバーではなく私の端末エミュレータに頼っているからです)。 ロケールが正しく設定されているようです。私の考えでは、ログインプロンプトの後に開かれた端末がgetty「Unicodeレンダリングモード」でまったく始まっていないようです(これについての技術用語はわかりません)。印刷して手動でUni...

Admin

lsが中国語のファイル名を長さでソートするのはなぜですか?
unicode

lsが中国語のファイル名を長さでソートするのはなぜですか?

ls奇妙な動作が発生し、中国語のファイル名を理解できません。私はSIPが有効になっています(コアOSの変更はありません)、MacPortsがインストールされており、アメリカ英語がデフォルトの言語であるmacOS 13.6.1を実行しています。 まず、空のフォルダでこの小さなスクリプトを実行してテストファイルを作成します。 import random random.seed(42) for i in range(30): n = random.randrange(3, 8) fn = "".join(random.choice("一二三")...

Admin

バイト文字列の長さの代わりに '%10s' printf形式の文字列長を計算するようにawkに指示できますか?
unicode

バイト文字列の長さの代わりに '%10s' printf形式の文字列長を計算するようにawkに指示できますか?

次の出力を試してください|Ü| X|。 echo 'Ü X' | awk '{printf("|% 2s|% 2s|\n", $1, $2)}' 明らかにawk文字長ではなくバイト長が計算されるため、Ü数は2で、左マージンは必要ありませんX。 awk重要なモードで実行できますか?特徴バイト長ではなくパターン長%<count>s printfですか? これ同じbash問題がありますprintf。答えが違うことを願っています。 「libc printfへのパス」:-/ 私は〜だったいいえgawkバージョンに関係なく使用Ubuntu22.04(Jam...

Admin

groff -mandocは「ESC [1m」を生成し、バックスペースを使用して太字のテキストを再入力します。
unicode

groff -mandocは「ESC [1m」を生成し、バックスペースを使用して太字のテキストを再入力します。

utf8私はgroffが出力形式の太字のテキストを表示するために別の方法を使用していることを発見しました。 FreeBSD 14では、groffは[1m端末のエスケープコード(ESC、)をエクスポートします。 $ printf ".Dd today\n.Sh NAME\n" | groff -mandoc -Tutf8 | od -c 0000000 \n 033 [ 1 m N A M E 033 [ 0 m \n [...] Linuxでバックスペースと太字キーを使用する(debian Bookworm):...

Admin

UTF-8のMB_CUR_MAXが4ではなく6であるのはなぜですか? (Linux、glibc)
unicode

UTF-8のMB_CUR_MAXが4ではなく6であるのはなぜですか? (Linux、glibc)

MB_CUR_MAXglibc は、「現在のロケールにおけるマルチバイト文字の最大バイト数を表す正の整数表現」として定義されます。 私が得た値を印刷すると1。C私のシステムのロケールが.であるにもかかわらず、Cがデフォルトでロケールを使用するためだと思いますen_US.UTF-8。 これを私のプログラムに追加すると、setlocale(LC_ALL, "")環境のロケール使用が有効にMB_CUR_MAXなります6。 今私の質問はなぜ6ですか? UTF-8にはコードポイントあたり1〜4バイトのエンコーディングはありませんか? ...

Admin