Linux用の快適なオフライン音声認識ソフトウェアが必要ですか?

Linux用の快適なオフライン音声認識ソフトウェアが必要ですか?

私は〜を探していますオフラインLinux用の音声認識ソフトウェアはドイツ語でも扱われ、使いやすく設定が簡単です。

私はCMU Sphinxと他の多くを試しましたが、すべて1つの共通点があります。主に良いマニュアルが不足しており、概念が非常におおよそのため、インストール/使用が複雑すぎます。 「可用性」という用語を使用します。)

それでは、限られた時間内に設定して設定し、認識されたコマンドに基づいてスクリプトを実行でき、完全にオフラインで動作できる音声認識ソフトウェアがありますか?つまり、音声分析にクラウドサービスやリモートサーバーは必要ありません。言葉?私も動作し、動作するソリューションに喜んでお金を費やすでしょう!

すべてのヒントとアイデアを歓迎します!

ありがとうございます!

PS:私はこのトピックを知っていますLinuxに役立つ音声認識ソフトウェアはありますか?- しかし、そこに提供された答えはオフラインソリューションを指していません!

答え1

Michael Sheltonがすることに注目する価値があります。 http://blog.mikeasoft.com/2017/12/30/speech-recognition-mozillas-deepspeech-gstreamer-and-ibus/

警告:私の考えにはまだ実用的な用途はありません。でも…一生懸命構成した末についに音声単語(英語…ドイツ語がわからない)を認識できました。

Mike SheldonはMozillaのDeepSpeechモデルを使用していますが、本当に良いです。

このページのコメント(私の100番目のコメントは音声認識に成功したとき)は2018年7月に中断されたようです。その人がまだ努力しているかはわかりません。

答え2

努力するナッドを書き込むデモ動画)。

私は同じ問題に遭遇し、最終的に私自身のツールを書くことになり、いくつかの独善的な決定がありましたが、一般的に基本的な口述要求にうまく機能することがわかりました。(優れたものに基づいてVOSK-API)

答え3

最近私が書いた記事は、この情報のいくつかについてもっと詳しく答えます(以下の情報のいくつかはgebとadabruに提供されています)。これは、読んで、ブックマークし、更新を確認するのに役立ちます。Linuxの視線追跡とヘッド追跡ソリューション

Addabruによると、これはより効率的で設定が簡単なオプションです。https://handsfreecoding.org/そして私がオンラインで会った他の多くの人:https://talonvoice.com

音声言語を分析するためにオフラインで動作しているようです(7.プライバシーを参照)。https://talonvoice.com/EULA.txt

この記事を書くときに月25ドルのベータ版を支払うと、TalonのVoskエンジンを使用してドイツ語のサポートを受けることができます(サポートされている言語についてはVoskとTalonコミュニティのWikiを参照)。

https://alphacephei.com/vosk/

https://talon.wiki/speech_engines/

https://talon.wiki/faq/#are-言語s-other-than-english-supported

Talonには無料版もありますが、Talonがすべてオープンソースではないことに注意してください。

ヌメンをよく見てみましょう。 Voskを使用した無料のオープンソースソフトウェアであり、ドイツ語をサポートしています。主にキーボード中心のプログラム(一部はリンクにリストされています)を使用している場合、これは非常に良い選択肢です。https://git.sr.ht/%7Egeb/numen

あなたのニーズに合った他のVoskプロジェクトがあるかもしれません。https://alphacephei.com/vosk/integrations

TalonでDragonを使用できますが、DragonはWindowsでデフォルトで使用されます。私が知っている限り、WindowsでLinux仮想マシンを使用するか、WindowsでCygwinを使用する必要があります(参照:https://handsfreecoding.org/using-dragon-with-linux)。おそらくあなたが探しているものではないかもしれませんが、Dragonはドイツ語をサポートしています。そして、NuanceはDragonがオフラインで作業して音声単語を分析できることを覚えています(これをもう一度確認します)。また、ドラゴンとドラゴンフライを使用することができます。https://handsfreecoding.org/。 Dragonの費用は約300ドルから500ドルです(参照:https://talon.wiki/speech_engines/)これは排他的です。私の経験に照らして、私は個人的にドラゴンをお勧めしませんし、最初の考慮事項ではありません。

関連情報