character-encoding

正規表現:商標記号がazと一致するのはなぜですか?
character-encoding

正規表現:商標記号がazと一致するのはなぜですか?

重複したり基本的な質問であれば申し訳ありません。検索が難しい™。ファイル名から奇妙な文字を削除するスクリプトを作成しています。 商標記号を™一致させる方法は[^a-z]? ? ? $ echo "AMD Ryzen™ 5 2600X Processor rstuv" |sed 's/[^A-Z]//g' AMDRXP $ echo "AMD Ryzen™ 5 2600X Processor rstuv" |sed 's/[^a-z]//g' yzen™rocessorrstuv $ echo "AMD Ryzen™ 5 2600X Processor r...

Admin

電子文字を半角文字に(またはその逆に)変換するには?
character-encoding

電子文字を半角文字に(またはその逆に)変換するには?

これは、コマンドラインで半分の幅を全幅に変換する方法に関する簡単な質問です。私はこれが私のコマンドラインに組み込まれると思いましたが、iconvここでは何も見つかりません。 $ iconv -l | grep -i full -> nothing $ iconv -l | grep -i half -> nothing 一般的な入力は次のとおりです。 $ echo -n "Ab9876543210" | iconv -f utf8 -t utf16be | hexdump -C 00000000 ff 21 00 62 ff 19 ff ...

Admin

JSON文字列がある場合、それを格納するのに必要なバイト数をどのように計算しますか?
character-encoding

JSON文字列がある場合、それを格納するのに必要なバイト数をどのように計算しますか?

Webページにjson文字列形式が表示されています。私が知りたいのは、このjson文字列に必要なバイトサイズです。 コピーしてパイプすることで文字数をwc -c得ることができますが、1000インターネット検索で提案を見たように、json文字列が1000バイトという意味ではありません。 私が混乱している理由は次のとおりです。 Javaでは、たとえばaはで構成Stringされ、char各文字はutf-8をサポートするために2バイトです。 Jsonはutf-8もサポートしているので、json文字列のサイズが2000バイトであるべきかどうかを検討する必要があるのか​...

Admin

端末の奇妙な/間違った文字
character-encoding

端末の奇妙な/間違った文字

私は使うDebian SIDそしてターミネーター私の端末エミュレータです。システムを更新して前回(昨日2023/11/22)を再起動すると、端末の一部のコマンドに奇妙な文字が表示されます。 ただし、SSHを介してArch Linuxに接続されている同じ端末で同じコマンドを実行すると、問題なく動作します。 編集1: 全体の問題プロセスを示す画面を記録しましたが、ここにあります。協会(より良い視聴のためにビデオを最大化してください)。とにかく段階的に説明します。 terminatorオープニングで... 分ける水平(終了者) 後ろにトップパネルに移動(ターミ...

Admin

CRLF行終端を使用してISO-8859テキストを変更する方法
character-encoding

CRLF行終端を使用してISO-8859テキストを変更する方法

テキストファイルのエンコーディングをUTF-8に変更しようとしています。 私はUnixに初めて触れたので役に立ちます。再エンコード機能を使用して正しくエンコードする方法がわかりません。 ...

Admin

バイト文字列の長さの代わりに '%10s' printf形式の文字列長を計算するようにawkに指示できますか?
character-encoding

バイト文字列の長さの代わりに '%10s' printf形式の文字列長を計算するようにawkに指示できますか?

次の出力を試してください|Ü| X|。 echo 'Ü X' | awk '{printf("|% 2s|% 2s|\n", $1, $2)}' 明らかにawk文字長ではなくバイト長が計算されるため、Ü数は2で、左マージンは必要ありませんX。 awk重要なモードで実行できますか?特徴バイト長ではなくパターン長%<count>s printfですか? これ同じbash問題がありますprintf。答えが違うことを願っています。 「libc printfへのパス」:-/ 私は〜だったいいえgawkバージョンに関係なく使用Ubuntu22.04(Jam...

Admin

ASCII以外の文字を保存する方法は?
character-encoding

ASCII以外の文字を保存する方法は?

サーバーにはデフォルトのPOSIXロケールがありますが、ヘブライ語などの非ASCII文字がサーバーにアップロードされると、次のように変更されます。סק××ת×××××××××ס×ש×××、そのまま保存するにはどうすればよいですか? ...

Admin

ISO-IR-87からUTF-8エンコーディングへの変換
character-encoding

ISO-IR-87からUTF-8エンコーディングへの変換

私はDebianとその派生物を研究しています。生の入力ISO-IR-87をUTF-8に変換したいです。簡単な方法がありますか? 参考までに: % iconv -l | grep "IR-8" ISO-IR-8-1// ISO-IR-84// ISO-IR-85// ISO-IR-86// ISO-IR-88// ISO-IR-89// % dpkg -S /usr/bin/iconv libc-bin: /usr/bin/iconv % apt-cache policy libc-bin libc-bin: Installed: 2.36-9+deb...

Admin

viを使用して別のエンコーディングでファイルを作成する理由
character-encoding

viを使用して別のエンコーディングでファイルを作成する理由

Bashスクリプトを使用するときは常にvi。 私は理論的に正しく書かれたスクリプトをデバッグしていて、fileこのコマンドで生成されたファイルを調べることにしました。これが私が見るものです。 myScript1 Bourne-Again shell script text executable, Unicode text, UTF-8 text myScript2 ASCII text myScript3 POSIX shell script text executable, ASCII text myScript4 Unicode text, UT...

Admin

シェル出力エンコーディングが正しくありません。
character-encoding

シェル出力エンコーディングが正しくありません。

私はLinuxの専門家ではありませんが、Linux Buildrootで実行されるソフトウェア開発に従います。デバイスは、グラフィカルインタフェースプログラムを使用したり、シェルにアクセスしたり、シリアルケーブルまたはSSHを介してのみ接続できます。デバイスのエンドユーザーは、Wi-Fiネットワークに接続することを選択できます。 このプログラムはC ++で書かれており、スキャンを実行して利用可能なWi-Fiネットワークのリストを取得するには、シェルコマンドを実行する必要があります。 私の問題は、このタスクの結果のエンコードにあります。アクセント付きの文字を正...

Admin

bash カーソル移動コマンド
character-encoding

bash カーソル移動コマンド

では、bash発音区別記号を入力するときにカーソルを移動するとコマンドが複雑になり、編集が難しくなります。 一部のサーバーでこの現象が検出されたため、SSHを介してそのサーバーにアクセスしますが、ラップトップから直接アクセスしません。キャラクター設定に問題があるのでしょうか? bashは広い文字で誤動作しますか?より一般的に解決策はありますか? ~.basrc: # ~/.bashrc: executed by bash(1) for non-login shells. # see /usr/share/doc/bash/examples/startup-...

Admin

rsync --iconv を使用して MacOS ファイルを NAS に転送すると、同期が繰り返されます。
character-encoding

rsync --iconv を使用して MacOS ファイルを NAS に転送すると、同期が繰り返されます。

~によるとこのヒントそして、同様の提案(バージョン3.2.7)--iconvのオプションを使用して、rsync分音符(ä ü ö...)を持つファイルを私のSynology NASに同期しています。ただし、この--iconvオプションは期待どおりに機能しません。 rsync -vaN --delete --iconv=utf8-mac,utf8 Mac_folder/ NAS_folder/ うまくいきますが、コマンドを繰り返すと、コピープロセスは引き続き再開されます。発音区別符号付きのすべてのファイルとフォルダ 「間違った」方向の使用: rsync -v...

Admin

Curl コマンドを使用して文字セットを指定します。
character-encoding

Curl コマンドを使用して文字セットを指定します。

漢字リストを抽出しようとしています。https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=MOBashスクリプトを作成します。しかし、私が走るとき curl -o list.txt https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=MO 私はカールがWebサイトで使用しているGB2312エンコーディングの代わりにUTF-8エンコーディングを使用して、中国語の文字をランダム...

Admin