私は現在Piで継続的な音声認識を実装しようとしています。 2つのスレッドを実行してこれを行います。そのうちの1つはarecord
X秒間続けて(bashスクリプトで)記録し、その情報をWAVに保存してから毎回再起動します。このWAVが作成されると、他のスレッドがWAVファイルの認識を実行します。
これはうまく機能しますが、ユーザーの文章が誤って壊れてから次の録音ループで再開されると、文章は2つの認識結果の間で断片化されます。
私の質問:あなたの音レベルが特定のしきい値を下回るまで録音が行われるようにして、文全体が録音にキャプチャされるようにする方法はありますかarecord
?その後、ユーザーが何秒間話を止めると、録画が中断されますか?
(しかし、私はこれをすべて行うためにPythonを使用しています)
また、この問題を解決するより良い方法がある場合は、提案を歓迎します。私はPiに初めて触れた人であり、Piができるすべての素晴らしい仕事にはあまり慣れていません。