WindowsでStable Diffusion 2.0を使用する(xFormersあり)

公開日:2022年11月26日
最終更新日:2022年12月10日


Version 2.1の記事を新たに書きました。
touch-sp.hatenablog.com

はじめに

WindowsでStable Diffusion 2.0を使用する方法を書きます。

別記事にWSL2での使用も書きましたので良かったらそちらも読んで下さい。
touch-sp.hatenablog.com

PC環境

Windows 11
RTX 3080(VRAM 12GB)
CUDA 11.6.2
Git for Windows 2.37.3
Python 3.9.13

環境構築

あらかじめCUDAのインストールは済ませておいて下さい。
cuDNNのインストールは不要です。

Python環境へのライブラリインストールはすべてpipで可能です。

あらかじめWindows用にビルドされた「xFormers」をダウンロードしておく必要があります。

こちらから「windows-2019.zip」をダウンロードして解凍します。(ページの下の方からダウンロード可能です)


その中に様々なバージョンのxFormersファイル(拡張子whlのファイル)があります。


今回は「xformers-0.0.15.dev0+8910bb5.d20221124-cp39-cp39-win_amd64.whl」を使いました。


その他のライブラリのインストールを簡単にするために「requirements.txt」にまとめました。自分のGitHubに公開しているのでだれでも利用可能です。

それを使うと以下の3行で環境構築は終了します。

pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116
pip install xformers-0.0.15.dev0+8910bb5.d20221124-cp39-cp39-win_amd64.whl
pip install -r https://raw.githubusercontent.com/dai-ichiro/env4stable-diffusion/main/v2/requirements.txt

実行方法

リポジトリのクローン

git clone https://github.com/Stability-AI/stablediffusion.git
cd stablediffusion

学習済みパラメーター「768-v-ema.ckpt」のダウンロード

こちらのサイトから「768-v-ema.ckpt」をダウンロードします。
保存先は「stablediffusion」フォルダ直下としました。

いよいよ実行

python scripts/txt2img.py --prompt "a professional photograph of an astronaut riding a horse" --ckpt 768-v-ema.ckpt --config configs/stable-diffusion/v2-inference-v.yaml --H 768 --W 768 --n_samples 2

他の環境

1

Windows 11
CUDA 11.6.2
Python 3.10.9
pip install torch==1.13.0 torchvision==0.14.0 --extra-index-url https://download.pytorch.org/whl/cu116
pip install xformers-0.0.15.dev0+4c06c79.d20221205-cp310-cp310-win_amd64.whl
pip install -r https://raw.githubusercontent.com/dai-ichiro/env4stable-diffusion/main/v2/requirements.txt

「xformers-0.0.15.dev0+4c06c79.d20221205-cp310-cp310-win_amd64.whl」はこちらからダウンロードしました。