複数の短いファイルをリンクして作成された長いオーディオファイルがあります。私は音声セグメント間のサイレントを検出し(私の目的にはしきい値だけで十分です)、これを絶対ゼロに置き換えて背景「ノイズ」がないようにしたいと思います。録音の長さを保存することが私にとって重要です。
私はsoxがファイルの始まりと終わりで無音を検出できることを知ってsilence
いreverse
ますpad
。開始+終了だけでなく、ファイルのどこからでもこれを行う方法はありますか?
UPD:Linux用の音声アクティビティ検出ツールがあるかどうかを尋ねる非常に複雑な方法かもしれません。
答え1
ソックスsilence
オプションを使用してください:
sox [input] [output] silence 1 1 2% -1 0.5 2%
ファイルの前の無音時間を1秒に短縮し、間隔を0.5秒に短縮します。私の場合、2%がノイズフロアを無視します。 0%があなたに役立ちます。
-1
各インスタンスを処理するようsoxに指示します。