【拡張】ReazonSpeechをPySide6から使う（Claude 3.5 Sonnetに機能を拡張してもらいました）

文字起こし PySide6

はじめに前回のスクリプトを拡張してもらいました。 touch-sp.hatenablog.com 録音すれば、録音した順にどんどん勝手に文字起こししてくれるようにしました。Claude 3.5 Sonnetとのやりとり2回のやり取りで終わりました。 1回目に出力されたスクリプトはうま…

#ReazonSpeech

2024-10-20

ReazonSpeechをPySide6から使う

文字起こし PySide6

はじめにReazonSpeechを使うためにC#でGUIを作ったり、Gradioを使ったりしました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回はPySide6を使ってみました。PC環境 Windows 11 Python 3.11 CUDA 11.8Python環境構築 pip install torch==2.5.0+cu1…

#ReazonSpeech

2024-10-20

ReazonSpeechをGradioから使う

文字起こし

はじめに前回ReazonSpeechを使うためのGUIをC#で作りました。 touch-sp.hatenablog.com 今回はGradioを使いPythonだけで完結させようと思います。PC環境 Windows 11 Python 3.11 CUDA 11.8Python環境構築ReazonSpeechと最新のGradioは共存できませんでした。…

#ReazonSpeech

2024-10-06

【ReazonSpeech】日本語音声の文字起こしのためのGUIをC#で作りました。

文字起こし C#とPythonの連携

はじめに前回の続きです。 touch-sp.hatenablog.com 今回はGUIを作りました。環境 Windows 11 .NET framework 4.8 Newtonsoft.Json 13.0.3 (from NuGet)C#コードまずはボタンとテキストボックスがセットになったユーザーコントロールを作りました。 using Sy…

#ReazonSpeech

2024-10-06

【ReazonSpeech】日本語音声の文字起こしにチャレンジしました。（2回目）

文字起こし

はじめに以前も同様のことをしました。 touch-sp.hatenablog.com 1年半ぶりに再チャレンジしました。だいぶ使い方が変わっていました。使用したモデルモデルの比較はこちらです。（公式ページから転載）これを見て「ReazonSpeech NeMo」を使うことにしまし…

#ReazonSpeech

2024-05-21

【Candle】Rustなんか触ったこともない人間がRustを使ってOpenAI/Whisperを実行するまでの全手順（CUDAあり）

文字起こし

はじめにWhisperはOpenAIが公開しているSpeech2Textモデルです。音声ファイルを用意すればそれを文字起こししてくれます。以前Pythonから使ったことがあります。【Whisper】日本語音声の文字起こしにチャレンジしました。【OpenAI/Whisper】日本語音声の文…

#Whisper #Candle

2023-12-23

【OpenAI/Whisper】日本語音声の文字起こしをする際に専門用語に弱い点を克服する方法。

文字起こし

はじめに large-v2とlarge-v3の比較 large-v2 Pythonスクリプト「run.py」実行結果 large-v3 Pythonスクリプト「run.py」実行結果ここから本題 Pythonスクリプト「run.py」実行結果はじめにWhisperにlarge-v3という新しいモデルが追加されていたので…

#Whisper

2023-05-18

【ReazonSpeech】日本語音声の文字起こしにチャレンジしました。

文字起こし

「ReazonSpeech」を使って日本語音声の文字起こし（音声からテキストを作成）にチャレンジしました。Pythonを使えば3行のスクリプトで目的が達成できました。導入も簡単です。

#ReazonSpeech

2023-05-13

【Whisper】日本語音声の文字起こしにチャレンジしました。

文字起こし

「Whisper」を使って日本語音声の文字起こし（音声からテキストを作成）にチャレンジしました。Pythonを使えば4行のスクリプトで目的が達成できました。導入も簡単です。

#Whisper