概要

2024-6-2 • tag-icon

iconvutf-8 文字列を通常のASCII文字列に「変換」するコマンドを使用して、文字を最も近いASCII文字に置き換えることができます。しかし、私の問題は、含める結果文字列が必要であることです。まったく同じ文字数（コードポイント）をソース文字列として使用します。たとえば、ポンド（£）文字は3桁の文字（）または2桁の文字に置き換えられますGBP。代わりにこの文字を次に変更したいと思います。æae一つ文字（例えば、Lまたは?またはa）e。どのような方法/オプションがありますか？

概要

私はラテン語ベースのテキスト用の「ASCIIベースの」ルックアップルーチンを開発したいと思います。たとえば、位置3は5（1文字ではなく3文字に拡張されるfind 'uco' in '£Húçôz'ため）の代わりに返される必要があります（最初の位置である1から計算を開始します）。£私が開発したいのははるかに複雑です。ここでは、問題をできるだけ単純化しようとしています。

また、これを参照してください探すASCII以外のラテン語ベースのテキスト文字列を一致させる場合、ルーチンは完璧である必要はありませんが、一致（存在する場合）の（最初の）位置は正しい文字（コードポイント）の位置を指す必要があります。

概要

関連情報