speech-recognition

音声録音と翻訳

「wav」を「flac」に変換する際に問題があります。注文する: arecord -D plughw:0,0 -f cd -t wav -d 0 -q -r 16000 | flac - -s -f --best --sample-rate 16000 -o daveconroy.flac 常に以下を提供します。エラー：生のフォーマットオプション（--endian、--sign、--channels、--bps、および-sample-rate）は、raw以外の入力では許可されていません。次のコマンドを使用して録音できますが、再生中にノイズが非常に...

Admin 2024-6-7

speech-recognition

X11を使用して音声認識を手動で開始/終了するには？

うまく動作する音声認識ソフトウェアが見つかりました（参照この問題)、それでも統合が必要で、私の場合はそれを有効にする簡単な方法が必要です。私が探している結果は次のとおりです。ショートカットキーを押すと、書き込まれます。口述を終了するには、ショートカットキーを押します。キーボードで入力したように結果が印刷されます。おそらくシェルスクリプトを使用して管理できます（レコーダーを手動で制御し、それを使用してxdotool結果を入力します）。しかし、解決策がすでに存在する可能性があるので、このように質問します。 ...

Admin 2024-6-7

speech-recognition

Linux音声認識ソフトウェアに関するフィードバック

Linux用の音声認識ソフトウェアに関するフィードバックを受けたいです。無料でも有料でも.. すべてのプログラムで入力でき、Enterキーを右クリックすることができます。私は現在NaturallySpeakingを使用しています。 Windows 10で切り替えたいです。ありがとう ...

Admin 2024-6-6

speech-recognition

簡単な音声コマンド検出

マイクで簡単な単語やフレーズを検出し、そのフレーズに基づいてアクションを実行したいと思います。 PythonライブラリとGoogle Text to Speechを見ましたが、これらは過剰であるようです1。英語のすべての音素や単語を認識できるものは必要ありません。「go to bed」や「sleep」などの特定のフレーズを検出して、コンピュータをスリープモードに切り替えたいだけです。あれこれ検索してみましたが、ほとんど10年前の口述プログラムと投稿だけを見つけましたね。 1. 例えば、偶然発見した。この記事Webサービスに依存するか、Sphinxなどの重...

Admin 2024-6-6

speech-recognition

Pythonプログラムの実行中にエラーが発生しました。

音声認識とpyオーディオでPythonを実行中にエラーが発生しました。 ALSA lib pcm_dsnoop.c:641:(snd_pcm_dsnoop_open) スレーブ ALSA lib を開けません pcm_dmix.c:1089:(snd_pcm_dmix_open) スレーブ ALSA lib を開けません pcm.c:2642:(snd_pda .rear ALSA lib pcm.c:2642:(snd_pcm_open_noupdate) 不明な PCM カード.pcm.center_lfe ALSA lib pcm.c:2642:(s...

Admin 2024-6-4

speech-recognition

Kali - kaldi/egs/voxforge/s5 run.shの問題

起動しようとしましたがrun.sh失敗しました。誰もが問題を解決する方法を知っていますか？起動後の端末のテキストrun.sh： There was an error running the SLURM sbatch command. The command was: '/usr/bin/sbatch -o exp/make_mfcc/train/q/make_mfcc_train.log --export=none,PATH=/home/kvcper/kaldi/egs/voxforge/s5/../../../src/bin:/home/kvcper/k...

Admin 2024-6-2

speech-recognition

Linux用の快適なオフライン音声認識ソフトウェアが必要ですか？

私は〜を探していますオフラインLinux用の音声認識ソフトウェアはドイツ語でも扱われ、使いやすく設定が簡単です。私はCMU Sphinxと他の多くを試しましたが、すべて1つの共通点があります。主に良いマニュアルが不足しており、概念が非常におおよそのため、インストール/使用が複雑すぎます。「可用性」という用語を使用します。）それでは、限られた時間内に設定して設定し、認識されたコマンドに基づいてスクリプトを実行でき、完全にオフラインで動作できる音声認識ソフトウェアがありますか？つまり、音声分析にクラウドサービスやリモートサーバーは必要ありません。言葉？...

Admin 2024-5-30

speech-recognition

Juliusで辞書ファイル全体を使用するか、nullを返します。

正常に設定しましたユリウス私自身の構文と.vocaファイルを使用します。私が経験している問題は、話しているフレーズが.vocaファイルで何もないように聞こえても、常に提案された応答を返すことです。一致するものがない場合は、nullを返すか、辞書ファイル全体を使用して単語を抽出するソリューションを見つけたいと思います。誰かが私がこれを見つけるのを手伝ってくれるか、少なくとも正しい方向を教えてもらえますか？ ...

Admin 2024-5-24

speech-recognition

Linuxに役立つ音声認識ソフトウェアはありますか？

質問の簡単なバージョン：私はLinux上で動作し、正確さと使いやすさのある音声認識ソフトウェアを探しています。すべてのライセンスと価格は大丈夫です。テキストを書き込もうとしているので、音声コマンドに限定されてはいけません。詳細は：以下を試しましたが、結果は満足できません。カーネギーメロン大学スフィンクス C音声制御耳ユリウスカーディ（例えば、Kaldi GStreamerサーバー) IBMビアボイス（Linuxで実行されていますが、数年前に中断されました） NICO人工ニューラルネットワークツールキットオープンハートスピーチ RWTH AS...

Admin 2024-5-23

speech-recognition

Pocketsphinx_continuousの出力をファイルにリダイレクトする

私は醜い命令を持っています： pocketsphinx_continuous -samprate 48000 -nfft 2048 -hmm /usr/local/share/pocketsphinx/model/en-us/en-us -lm 9745.lm -dict 9745.dic -inmic yes 分解：ノイズを聞き、ノイズが検出されたらそれを聞いて音声認識を実行します。コマンド出力には多くのゴミがあり、1行だけ重要です。以下は音声認識の出力です。 READY.... Listening... INFO: cmn_prior.c(1...

Admin 2024-5-23

speech-recognition

音声をテキストとして実行し、結果を変数に保存するには？

コンピュータのマイクに向かって話し、私が言う内容をテキストに変換してから、それをシェル変数として使用したいと思います。可能ですか？私はGoogleの音声入力機能を使用するとこれを行うことができると思いました。 ...

Admin 2024-5-23

speech-recognition

C++ コンパイルされたプログラムをバックグラウンドで実行し、必要に応じて入力を送信します。

次の構造を持つUNIX環境用にC ++で書かれたコンパイルされたプログラムがあります。 int main(){ ... LoadEngine() ... while(1){ std::cin >> buffer; ... ExecuteFunction(buffer); } } エンジンのロードにはかなり時間がかかるため、まずバックグラウンドでプログラムを起動してから、必要に応じて入力を送信してみました。最後に標準のアンパサンドを追加してプログラムを実行すると、プログラムはバックグラウンドで実行されているように見...

Admin 2024-5-22

speech-recognition

Pocketsphinx_continuousをstdinで読むことはできますか？

-adcdev 「入力に使用するオーディオデバイスの名前」という引数がありますが、これが標準入力になるかどうかはわかりません。 Pocketsphinx_continuousをstdinで読むことはできますか？ ...

Admin 2024-5-20

speech-recognition

サウンドレベルが十分に低くなるまで録音してください。

私は現在Piで継続的な音声認識を実装しようとしています。 2つのスレッドを実行してこれを行います。そのうちの1つはarecordX秒間続けて（bashスクリプトで）記録し、その情報をWAVに保存してから毎回再起動します。このWAVが作成されると、他のスレッドがWAVファイルの認識を実行します。これはうまく機能しますが、ユーザーの文章が誤って壊れてから次の録音ループで再開されると、文章は2つの認識結果の間で断片化されます。私の質問：あなたの音レベルが特定のしきい値を下回るまで録音が行われるようにして、文全体が録音にキャプチャされるようにする方法はありま...

Admin 2024-5-19

speech-recognition

ALSAのため、pythonpeer_recognitionlibマイククラスを使用できません。

Raspberry Pi用の音声認識プログラムを作成しようとしていますが、Pythonの音声認識ライブラリの使用にはいくつかの問題があります。エラーメッセージ（下記の投稿）を見ると、間違ったサウンドカードにアクセスするのは問題のようですが、PyAudio（マイククラスで使用されていると思います）と「arecord」を使って録音できます。以下は私が実行したいコードです。 import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: ...

Admin 2024-5-19