【Diffusers】「LTX Video」で動画作成(Text2Video)を行ってみる

PC環境 Windows 11 CUDA 12.4 Python 3.12Python環境構築 pip install torch==2.5.1+cu124 --index-url https://download.pytorch.org/whl/cu124 pip install git+https://github.com/huggingface/diffusers@ltx-integration pip install transformers accel…

Gradio 5.0以上でチャットボットを作る

はじめにGradio 5.0からチャットボットの作り方が大きく変わりました。 今回、実際に作ってみました。Pythonスクリプト import gradio as gr from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer from threading import Th…

【Intel Extension for PyTorch】「 Llama-3.1-Swallow-8B-Instruct-v0.2」をGradioを使ってローカルで使用する

モデル使用したモデルはこちらです。 huggingface.co PC今のところIntel Extension for PyTorchはPython3.11までしか対応していないようです。 Ubuntu 24.04 Intel Arc A770 Python 3.11Python環境構築Intel Extension for PyTorchを使うための環境構築はこ…

【Intel Arc A770】【Diffusers】Intel Extension for PyTorchを使ってStableDiffusion による Text2Image を行う

はじめに以前IPEX-LLMを使ってIntel Arc A770でText2Imageを行いました。 touch-sp.hatenablog.com 今回はIntel Extension for PyTorchを使ってみます。 github.com IPEX-LLMと似たようなもので別物のようです。詳細な違いはよくわかりません。 今回使用する…

Windows 11 で Hallo2 を使う時の環境をいろいろさぐってみた(WindowsでTritonを使う方法も)

はじめに前回の続きです。 touch-sp.hatenablog.com 動作可能な環境をいろいろさぐってみました。動作環境と環境構築Python 3.10 + CUDA 12.4 Windows 11 CUDA 12.4 Python 3.10pip install torch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 xformers --…

Windows 11 で Hallo2 を使ってみる

はじめに「Hallo2」は顔画像と音声ファイルからしゃべっている動画を作成するモデルです。「リップシンク」モデルと表現されることもあります。以前「SadTalker」というのを使ったことがあります。それと同じようなことができます。 touch-sp.hatenablog.com…

【Diffusers】Stable Diffusion 3.5 Mediumを使ってみる

はじめにStable Diffusion 3.5 Mediumが公開されたのでVRAM使用量を調べるため色々な方法で実行してみました。 はじめに 使用したPC 実行 Method-1: to("cuda") Method-2: enable_model_cpu_offload() Method-3: enable_sequential_cpu_offload() Method-4: …

【Diffusers】「Allegro」で動画作成(Text2Video)を行ってみる

PC環境 Windows 11 CUDA 12.4 Python 3.12Python環境構築 pip install torch==2.5.1 --index-url https://download.pytorch.org/whl/cu124 pip install git+https://github.com/huggingface/diffusers pip install transformers accelerate sentencepiece im…

【ESPnet】【WSL2】Python3.11 で ESPnet v.202409 を使う

はじめにESPnetはテキストから音声を合成するモデルです。こちらを見て下さい。 touch-sp.hatenablog.com 今回はタイトルにあるように一番新しいESPnet v.202409を使う方法です。PC環境 Ubuntu 22.04 on WSL2 CUDA 12.4.1Python3.11のインストール sudo add-…

【ESPnet】Windows11 で ESPnet を使ってみる

はじめに以前WSL2を使ってESPnetを使ったことがあります。 touch-sp.hatenablog.com 今回はWindows11で使ってみました。PC環境 Windows 11 CUDA 11.8 Python 3.10Python 3.11以降ではうまく環境構築できませんでした。Python環境構築 pip install torch==2.4…

anzu_flux v2.2のLoRAが公開されていたので使ってみる

huggingface.co Pythonスクリプト import torch from diffusers import FluxPipeline import gc def flush(): gc.collect() torch.cuda.empty_cache() model_id = "black-forest-labs/FLUX.1-dev" prompt="a photo of f5h8_woman holding a sign that says '…

【Diffusers】Stable Diffusion 3.5 Largeを使ってみる(VRAM 12GB未満で動作)

PC環境こちらのPCを使用しています。 Windows 11 RTX 3080 Laptop (VRAM 16GB) CUDA 11.8 Python 3.12Python環境構築 pip install torch==2.4.1+cu118 --index-url https://download.pytorch.org/whl/cu118 pip install diffusers[torch] pip install transf…