最近「Aqua Voice」とか「Speakly」とか「Typeless」という単語をよく耳にします。
いずれも音声入力のためのアプリです。流行っているのでしょうね。
ただ、有料であったり音声をクラウドで処理する問題があったりします。
Mistral AI が公開した Voxtral Mini 4B Realtime 2602の精度と速度がなかなか良かったので、ローカルで実行可能な音声入力アプリを自作してみました。
先日Voxtral Mini 4B Realtime 2602の記事を書きましたので参考までに。
こちらにvLLMでVoxtral Mini 4B Realtime 2602を動かす方法を書いています。
今回出来たものをGitHubに上げています。