mpg321またはaplay、sox、またはTTS(Text Speech)を使用してオーディオファイルを実行すると、オーディオファイルを2回目に再生したときにのみオーディオが正しく出力されます。
テキスト音声変換の例に基づいて、「Hello World!」と書くと「orld」だけが表示され、「You are a good boy」と書くと「a good boy」だけが表示されます。
この問題をどのように解決できますか?
これは、espeak、Google Api、VoiceRSS Apiなど、すべてのTTSで発生し、Ubuntu(14.04.1 LTS)だけでなく、以前のRaspberry Pi(Raspbian)でも発生します。 Medium
オーディオエンジンが始まるまでに0.5〜2秒程度の遅延が発生するためです。その後、オーディオの最初の2秒をスキップします。
同じオーディオを2回、3回実行すると、2回目からは正常に動作しますが、速度が速い場合にのみ...
テキストを読むために必要です。
Raspberry PiとUbuntu MachineはどちらもHDMI経由で接続されています。
どうすれば解決できますか?すべての言葉を教えてください?そして最初からオーディオを?
答え1
HDMIを介して接続された出力デバイスがシステムから受信を開始するデータストリームと同期するのに数秒かかります。まず、数秒の無音を追加するか、アプリケーションの実行中に再生を継続して同期を維持し、必要に応じてTTS出力をミキシングすることを検討できます。
編集:この質問に関連しているようで、そこにある提案も役に立ちます。askubuntu.com
答え2
pavucontrolをオンにすると同期がオンになっているので、TTSが必要なときに起動するだけです。
注:システムでこの機能をオンにするとSPDIFパススルー(Dolby Digitalなど)を開始できませんが、オフにしてパススルーを開始する前に数秒待つと機能します。