音声合成
はじめにESPnetはテキストから音声を合成するモデルです。こちらを見て下さい。 touch-sp.hatenablog.com 今回はタイトルにあるように一番新しいESPnet v.202409を使う方法です。PC環境 Ubuntu 22.04 on WSL2 CUDA 12.4.1Python3.11のインストール sudo add-…
はじめに以前WSL2を使ってESPnetを使ったことがあります。 touch-sp.hatenablog.com 今回はWindows11で使ってみました。PC環境 Windows 11 CUDA 11.8 Python 3.10Python 3.11以降ではうまく環境構築できませんでした。Python環境構築 pip install torch==2.4…
RVC WebUI(ddPn08/rvc-webui)を使うと、自分が用意した声を学習させてその声を使ってボイスチェンジが可能になります。
github.com はじめに以前から「Open JTalk」や「ESPnet」を使って音声合成にチャレンジしてきました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回は「Bark」というものにチャレンジしてみました。 今までチャレンジしてきた音声合成の中で最も簡…
以前にESPnetに関しての記事を書きました。 touch-sp.hatenablog.com その時にはPython3.10で動作させることができませんでした。 最近の改良でPython3.10でも動作するようになったようです。 以下の環境で問題なく動作しました。torch==1.13.1+cu117 Ubuntu…
はじめに前回ESPnetというのを使わせて頂き音声合成を行いました。 touch-sp.hatenablog.com スクリプトを一部変えるだけで様々な音声が合成できるようなので今回一部を試してみました。結果(3種類の音声)jsut前回と同じです。 text2speech = Text2Speech.…
最終更新日:2023年4月14日 はじめに PC環境 Python環境構築 Pythonスクリプト 用意するテキストファイル 使い方 インストールされたライブラリのバージョン その他の環境 2022年7月9日追記①(torch==1.12.0+cu113) 2022年7月9日追記②(torch==1.12.0+cu116…
open-jtalk本体のインストール sudo apt install open-jtalk辞書ファイルのインストール sudo apt install open-jtalk-mecab-naist-jdic音声のダウンロード・解凍 wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-…