文字起こし
はじめに前回のスクリプトを拡張してもらいました。 touch-sp.hatenablog.com 録音すれば、録音した順にどんどん勝手に文字起こししてくれるようにしました。Claude 3.5 Sonnetとのやりとり2回のやり取りで終わりました。 1回目に出力されたスクリプトはうま…
はじめにReazonSpeechを使うためにC#でGUIを作ったり、Gradioを使ったりしました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回はPySide6を使ってみました。PC環境 Windows 11 Python 3.11 CUDA 11.8Python環境構築 pip install torch==2.5.0+cu1…
はじめに前回ReazonSpeechを使うためのGUIをC#で作りました。 touch-sp.hatenablog.com 今回はGradioを使いPythonだけで完結させようと思います。PC環境 Windows 11 Python 3.11 CUDA 11.8Python環境構築ReazonSpeechと最新のGradioは共存できませんでした。…
はじめに前回の続きです。 touch-sp.hatenablog.com 今回はGUIを作りました。環境 Windows 11 .NET framework 4.8 Newtonsoft.Json 13.0.3 (from NuGet)C#コードまずはボタンとテキストボックスがセットになったユーザーコントロールを作りました。 using Sy…
はじめに以前も同様のことをしました。 touch-sp.hatenablog.com 1年半ぶりに再チャレンジしました。 だいぶ使い方が変わっていました。使用したモデルモデルの比較はこちらです。(公式ページから転載) これを見て「ReazonSpeech NeMo」を使うことにしまし…
はじめにWhisperはOpenAIが公開しているSpeech2Textモデルです。音声ファイルを用意すればそれを文字起こししてくれます。以前Pythonから使ったことがあります。 【Whisper】日本語音声の文字起こしにチャレンジしました。 【OpenAI/Whisper】日本語音声の文…
はじめに large-v2とlarge-v3の比較 large-v2 Pythonスクリプト「run.py」 実行 結果 large-v3 Pythonスクリプト「run.py」 実行 結果 ここから本題 Pythonスクリプト「run.py」 実行 結果 はじめにWhisperにlarge-v3という新しいモデルが追加されていたので…
「ReazonSpeech」を使って日本語音声の文字起こし(音声からテキストを作成)にチャレンジしました。Pythonを使えば3行のスクリプトで目的が達成できました。導入も簡単です。
「Whisper」を使って日本語音声の文字起こし(音声からテキストを作成)にチャレンジしました。Pythonを使えば4行のスクリプトで目的が達成できました。導入も簡単です。