![Linux の音声ディクテーションについてどのような提案がありますか? [閉鎖]](https://linux33.com/image/229956/Linux%20%E3%81%AE%E9%9F%B3%E5%A3%B0%E3%83%87%E3%82%A3%E3%82%AF%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%E3%81%A9%E3%81%AE%E3%82%88%E3%81%86%E3%81%AA%E6%8F%90%E6%A1%88%E3%81%8C%E3%81%82%E3%82%8A%E3%81%BE%E3%81%99%E3%81%8B%EF%BC%9F%20%5B%E9%96%89%E9%8E%96%5D.png)
いいですね。私は、Webベースのアプリケーションではなく、Linuxでネイティブに実行できる単純なリアルタイムの口述ツールを探しています。
コンテキストを調べるために、Googleでツアー、他のSE投稿を見て、同じ内容をもっと曖昧に質問し、ChatGPTについて尋ねて、GitHubで検索するなどの作業を行いました。
その中でも、vosk、sphinx、transcriber、その他のツールなど、さまざまなツールが上記で推奨されています。それらのどれも私に大きな成功を収めませんでした。
クラウドベースのMS Wordのバージョンでは、ディクテーションを試してみました。成功したがクラウドベースではないツールを好む。
私がこれを実装したいディストリビューションはDebianです。
試してみることができる代替ツール/パッケージに関する提案がある人はいますか?
更新:この回答が最も役に立ちました。 https://unix.stackexchange.com/a/772356/537545
Marcus Müllerが提供した地図のおかげで、SpeechNoteを設定して作業できるようになりました。本当にありがとうございました。
SpeechNoteで利用可能な多数の英語モデルをテストする予定で、ある時点で追加のアップデートを追加して、速度、正確性、および自動ガベージ挿入の欠如に関してどのモデルが最適かを判断します(「このソフトウェアをご利用いただきありがとうございます」挿入タイプ)
その間、人々に他のソフトウェア提案がある場合は、いつでも追加の貢献をしてください。
みんなありがとうございます:)
答え1
試してみたいかもしれません講義ノート;何かを組み立てながらメモをするときに時々使用するので、自由な手が制限されます。
私は非常に明確なドイツのイントネーションを持っていますが、それは私が言うほとんどの英語に十分に効果的です。 「私のワードプロセッサに直接入力する」のようなことはしませんが、あなたの質問に関する限り、それは厳しい要件ではないと思いますか?
Speech Noteは、複数の音声モデルニューラルネットワークのフロントエンドです。最新のものでも最高でもありませんが、正直言って、Whisperは英語にはかなり良いです。コメントで述べたように、ほとんどの音声認識操作はLinuxを実行しているデスクトップで行われます。
私は持っていますFlathubからインストール;ノートブックはCPUよりも速く推論を実行でき、消費電力が低いGPUがないため、アクセラレータプラグインをインストールする必要はありません。したがって、Debian で実行するには、flatpak を設定し、Speech Note プログラムをインストールし、プログラムを実行して適切な英語モデルを選択する必要があります。
私はこれをDebianでテストしていませんが、flatpackのドキュメントでこれはうまくいきます:
# Check whether flatpak is installed, and install it if not
flatpak --help > /dev/null || sudo apt install flatpak -y
# end of debian-specific instructions.
# Set up the flatpak software repo
flatpak remote-add --if-not-exists flathub https://dl.flathub.org/repo/flathub.flatpakrepo
# Install Speech Note in container environment
flatpak install net.mkiol.SpeechNote
DebianがSpeechNote用のメニュー項目を持っているのにこれが十分かどうかはわかりません。とにかく直接起動できます。
flatpak run net.mkiol.SpeechNote
ここで言語ボタンをクリックして英語を選択してください。 Speech to Textで「English (FasterWhisper Small)/en」を選択し、ダウンロードボタンをクリックしてください。ダウンロードが完了するまでお待ちください。ダイアログボックスを閉じて、左上のハンバーガーメニューアイコンに移動し、設定に移動し、音声テキスト変換に移動して正しいオーディオソースを選択します。ダイアログボックスを閉じます。
準備ができました。 「リスニング」ボタンをクリックして慈悲深い独裁者になろう!
編集する:実際の適用は次のとおりです。(映像のミュートを必ず解除してください)