概要

概要

iconvutf-8 文字列を通常のASCII文字列に「変換」するコマンドを使用して、文字を最も近いASCII文字に置き換えることができます。しかし、私の問題は、含める結果文字列が必要であることです。まったく同じ文字数(コードポイント)をソース文字列として使用します。たとえば、ポンド(£)文字は3桁の文字()または2桁の文字に置き換えられますGBP。代わりにこの文字を次に変更したいと思います。æae一つ文字(例えば、Lまたは?またはae。どのような方法/オプションがありますか?


概要

私はラテン語ベースのテキスト用の「ASCIIベースの」ルックアップルーチンを開発したいと思います。たとえば、位置3は5(1文字ではなく3文字に拡張されるfind 'uco' in '£Húçôz'ため)の代わりに返される必要があります(最初の位置である1から計算を開始します)。£私が開発したいのははるかに複雑です。ここでは、問題をできるだけ単純化しようとしています。

また、これを参照してください探すASCII以外のラテン語ベースのテキスト文字列を一致させる場合、ルーチンは完璧である必要はありませんが、一致(存在する場合)の(最初の)位置は正しい文字(コ​​ードポイント)の位置を指す必要があります。

関連情報