【SDXL 1.0】Diffusers から Textual Inversion が使えるようになったのでさっそく使ってみました。

画像生成

結果一番左がNegative Promptなし真ん中がunaestheticXL AYv1を使った場合一番右がunaestheticXL v3.1を使った場合使い方 from safetensors.torch import load_file state_dict = load_file("embeddings/unaestheticXLv31.safetensors") pipe.load_textua…

#Stable Diffusion XL

2023-09-13

GROVE接続のLCD（液晶ディスプレイ）が神だった件

Arduino

今回の商品 GROVE - 16 x 2 LCD（青背景・白文字）www.switch-science.com 使用例接続がめちゃめちゃ簡単です。 Arduinoスケッチ #include <Wire.h> #include <rgb_lcd.h> rgb_lcd lcd; void setup() { lcd.begin(16, 2); lcd.print("hello, world!"); } void loop() { } ちなみ</rgb_lcd.h></wire.h>…

2023-09-12

【SDXL Caricaturized Lora】Image2Image と LoRA を組み合わせて顔写真から似顔絵を作成する

画像生成

はじめにImage2Image + LoRAは以前に試しています。 touch-sp.hatenablog.com 今回は「SDXL Caricaturized Lora」というLoRAを使って顔写真から似顔絵を作成してみます。結果一番左がもとの顔写真、右3枚が今回作成した画像です。 3年程前に「WarpGAN」とい…

2023-09-11

【AnimateDiff】Motion Module v2 が公開されて作成動画の質が向上したそうです。さっそく試してみました。

動画生成

github.com 結果作成動画はGoogle Bloggerに載せています。 support-touchsp.blogspot.com 環境 Windows 11 CUDA 11.7 Python 3.10 Git for Windows 2.39.0Python環境構築1行で完結します。 pip install -r https://raw.githubusercontent.com/dai-ichiro/m…

#AnimateDiff

2023-09-08

【Controlnet Animation】OpenMMLab の MMagic で Video2Video ができるという事で試してみました

動画生成

実行動画の準備今回はこちらからダウンロードした「dance26.mp4」という動画を使わせて頂きます。 600x600で75フレームある動画です。 Configファイルの書き換えこちらから「anythingv3_config.py」をダウンロードして一部を書き換えます。書き換え前 contr…

#MMagic #ControlNet

2023-09-08

OpenMMLab の MMagic を使って超解像。え、たったの3行？

超解像

はじめに以前から超解像の記事はいくつも書いてきました。超解像（Super Resolution）とは画像の解像度を上げることです。「アップスケール」と言われているものとほぼ同じだと思います。今まではOpenMMLabのMMEditingを使うことが多かったのですが、いつの…

#MMagic

2023-09-08

【StableDiffusionXLInstructPix2PixPipeline】ある画像に対して「写っている犬を猫に変えて」みたいなプロンプトで新しい画像が生成できる Instruct-Pix2Pix が SDXL に対応したのでさっそく使ってみました

画像生成

はじめに以前 Instruct-Pix2Pix の記事を書きました。 touch-sp.hatenablog.com 今回 SDXLに対応したとのことで改めて試してみました。 huggingface.co 768x768の画像データで学習されているようです。特徴写真に写る犬を猫に変換したい場合プロンプトは「re…

#inpainting #Stable Diffusion XL

2023-09-05

Windowsで OpenMMLab の MMagic を使って Matting

環境 WIndows 11 CUDA 11.7 Python 3.10Python環境構築 pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install mmcv==2.0.1 -f https://download.openmmlab.com/mmcv/dist/cu117/torch…

#MMagic

2023-09-04

Windowsで OpenMMLab の MMSegmentation v1.1.1 を使う

segmentation

環境 WIndows 11 CUDA 11.7 Python 3.10Python環境構築 pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install mmcv==2.0.1 -f https://download.openmmlab.com/mmcv/dist/cu117/torch…

2023-09-04

【SDXL 1.0】ControlNet と Inpaint を組み合わせると何ができるか？

画像生成

,はじめにDiffusers に「StableDiffusionXLControlNetInpaintPipeline」という SDXL 1.0 に対して ControlNet と Inpaint を組み合わせて使えるPipelineが実装されました。さっそく使ってみたいと思います。元画像元画像はぱくたそから使わせて頂きました。…

#Stable Diffusion XL #ControlNet #inpainting

2023-09-02

【悪用厳禁】顔をすり替える Roop を Stable Diffusion Web UI の拡張機能としてではなく単独で動かす

github.com はじめにディープフェイク画像が作れるという事で「悪用厳禁」、使用は「自己責任」でお願いします。WSL2を使いました。環境構築で難しいのはcudnnをインストールするところだけです。環境 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10準備cuDNN…

2023-09-02

GFPGANを使ってサクッと超解像【Windows】

超解像

はじめに PC環境 Pythonの環境構築学習済みモデルのダウンロードリポジトリのクローンいよいよ実行等倍 2倍にアップスケールここからが本題です結果追記はじめにGFPGANをWindows環境で使う方法を紹介します。 github.com PC環境 Windows 11 CUDA 11.…

#GFPGAN

2023-08-31

MasaCtrl が一部 SDXL 1.0 (Stable Diffusion XL 1.0) に対応しています。さっそく試してみました。

画像生成

github.com はじめにMasaCtrlに関しては過去に記事を書いているのでよかったら見て下さい。 touch-sp.hatenablog.com touch-sp.hatenablog.com 簡単に言うと一貫性のある画像（例えば同じキャラクターの姿勢違いなど）を生成することが可能なモデルです。 SD…

#Stable Diffusion XL #MasaCtrl

2023-08-29

【Diffusers】【StableDiffusionXLAdapterPipeline】SDXL 1.0 (Stable Diffusion XL 1.0) の T2I-Adapter が使えるようになりました

画像生成

huggingface.co はじめにDiffusersを使わない場合の記事を以前書きました。 touch-sp.hatenablog.com 今回、DiffusersからT2I-Adapterが使えるようになったので使い方を紹介します。方法Canny画像から画像生成もともとCanny画像が用意できているものとします…

#Stable Diffusion XL #T2I-Adapter

2023-08-28

【SDXL 1.0】fuduki_mix を公開している人が新たに haduki_mix というモデルを公開してくれました

画像生成

はじめに「fuduki_mix」というモデルを公開してくれている「kotajiro001」さんが新たにSDXL派生モデルとして「haduki_mix」というモデルを公開してくれています。この方は「yayoi_mix」というSD 1.5のモデルも公開してくれています。弥生（やよい：3月）文月…

2023-08-28

【SDXL 1.0】 Zoe-Depth ControlNet が Diffusers から公開されたのでさっそく使ってみました

画像生成 ControlNet

huggingface.co はじめに以前から「Depth」の ControlNet は公開されていました。 touch-sp.hatenablog.com 新たに「 Zoe-Depth」の ControlNet が公開されたので使ってみました。元画像こちらで作成した画像を使用しました。「girl.png」として保存していま…

#Stable Diffusion XL #ControlNet

2023-08-25

「layered-neural-atlases」で「StableVideo」の事前準備を行う

動画生成

はじめに「StableVideo」で自前の動画を元動画として使用する場合には事前学習が必要です。「StableVideo」については以下の記事を見て下さい。 touch-sp.hatenablog.com 事前学習を行うのが「layered-neural-atlases」です。さっそく「layered-neural-atla…

#StableVideo

2023-08-24

「layered-neural-atlases」が動かせる環境をつくる

動画生成

github.com はじめに前回「StableVideo」について記事を書きました。 touch-sp.hatenablog.com 自前の動画を元動画として使用する場合には事前学習が必要になります。それを行うのが「layered-neural-atlases」です。環境 Ubuntu 20.04 on WSL2 CUDA 11.6 P…

#StableVideo

2023-08-24

「StableVideo」という動画作成モデルがすごいです。AIによる動画作成がより実用的になった気がします。

動画生成

github.com 環境 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.11.4 Python環境構築は以下の1行です。 pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/StableVideo/requirements_cu118.txtこれで失敗するようなら以下を試し…

#StableVideo

2023-08-23

SDXL 1.0 (Stable Diffusion XL 1.0) に使える T2I-Adapter-SDXL が公開されているので紹介します

画像生成

環境Windows 11ではうまく動きませんでした。以下の環境で実行しています。 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10実行と結果元画像からCanny画像を作成してから画像生成SDXL 1.0-base python test.py \ --prompt 'portrait of japanese girl, plain w…

#Stable Diffusion XL #T2I-Adapter

2023-08-22

【SDXL 1.0】Diffusers で ControlNet と LoRA が併用できるようになったのでさっそく使ってみました

画像生成

はじめにタイトルにあるように Diffusers で SDXL に ControlNet と LoRA が併用できるようになりました。「DreamShaper XL1.0」というSDXL派生モデルに ControlNet と「Japanese Girl - SDXL」という LoRA を使ってみました。「Japanese Girl - SDXL」は日…

#Stable Diffusion XL #ControlNet #LoRA

2023-08-20

二つのマイコンを無線で接続出来たらラジコン作りたくなりますよね？ということで作ってみました。３号機です。

Arduino

はじめに前回ESP-WROOM-32同士をBluetoothで接続してシリアル通信を無線化しました。 touch-sp.hatenablog.com これが出来たらラジコン作りたくなります。ということで作ってみました。完成品車コントローラー特徴Groveコネクタを利用してなるべくはんだ…

2023-08-19

Diffusersに新たに実装された GLIGEN って何？どういった事ができるの？

画像生成

はじめにDiffusersからGLIGENというモデルが使えるようになりました。 github.com ControlNetと非常に似ているものになりますが、ボックスで物体の場所を指定できるところが特徴の一つです。今回はその特徴を使いながら画像生成をしてみました。まずはこの…

#GLIGEN

2023-08-18

【SDXL 1.0】yayoi_mix を公開している人がSDXL派生の fuduki_mix というモデルを公開してくれています

画像生成

はじめにリアルな（アニメではない）美しい女性が描けるモデルとして「yayoi_mix」があります。そのモデルを公開してくれている「kotajiro001」さんがSDXL派生モデルとして「fuduki_mix」というモデルを公開してくれています。さっそく使ってみました。使い…

#Stable Diffusion XL

2023-08-17

【SDXL 1.0】Multi-ControlNetを使ってみる

画像生成 ControlNet

はじめにDiffusersにSDXL用のMulti-ControlNetが実装されたので使ってみました。元画像元画像はぱくたそから使わせて頂きました。こちらの画像です。 1024x1024になるようにトリミング、リサイズして「girl.jpg」として保存しています。ここからImage2Ima…

#Stable Diffusion XL #ControlNet

2023-08-16

ESP-WROOM-32同士をBluetoothで接続してシリアル通信を無線化する

Arduino

使用したのはこちらです。二つ用意しています。 ESPr® Branch 32（Groveコネクタ付き）www.switch-science.com BluetoothのMACアドレスを取得する一つのESPに以下を書き込み実行します。今後こちらがスレイブ側になります。 void setup(void) { Serial.begin…

2023-08-15

【SDXL 1.0】 OpenPose ControlNet が公開されたのでさっそく使ってみました

画像生成 ControlNet

huggingface.co はじめに「Canny」「Depth」に続いて「OpenPose」の ControlNet が公開されました。「Canny」に関してはこちらを見て下さい。 touch-sp.hatenablog.com 「Depth」に関してはこちらを見て下さい。 touch-sp.hatenablog.com 元画像ぱくたその画…

#Stable Diffusion XL #ControlNet

2023-08-15

【SDXL 1.0】 Depth ControlNet が Diffusers から公開されたのでさっそく使ってみました

画像生成 ControlNet

huggingface.co はじめに「Canny」に続いて「Depth」の ControlNet が公開されました。「Canny」に関してはこちらを見て下さい。 touch-sp.hatenablog.com 元画像こちらで作成した画像を使用しました。「girl.png」として保存しています。 Depth画像の作成4…

#Stable Diffusion XL #ControlNet

2023-08-13

【SDXL 1.0】LoRA学習 (DreamBooth fine-tuning via LoRA) の設定あれこれ

画像生成

はじめに前回の続きです。 touch-sp.hatenablog.com より良い結果を求めて設定をいろいろいじってみました。今回はデータセットを二つ用意しました。一つ目は前回と同じもの（36枚）です。二つ目は新たに写真撮った28枚です。テキストエンコーダーの学習…

#Stable Diffusion XL #LoRA

2023-08-11

自前の画像でSDXL 1.0 (Stable Diffusion XL 1.0) のLoRA学習 (DreamBooth fine-tuning via LoRA) を行う

画像生成

はじめに今回の学習は「DreamBooth fine-tuning of the SDXL UNet via LoRA」として紹介されています。いわゆる通常のLoRAとは異なるようです。以前にサンプル画像を使って学習を行いました。 touch-sp.hatenablog.com 今回は自前の画像を学習させてみました…

#Stable Diffusion XL #LoRA

パソコン関連もろもろ

2023-01-01から1年間の記事一覧

【SDXL 1.0】Diffusers から Textual Inversion が使えるようになったのでさっそく使ってみました。

GROVE接続のLCD（液晶ディスプレイ）が神だった件

【SDXL Caricaturized Lora】Image2Image と LoRA を組み合わせて顔写真から似顔絵を作成する

【AnimateDiff】Motion Module v2 が公開されて作成動画の質が向上したそうです。さっそく試してみました。

【Controlnet Animation】OpenMMLab の MMagic で Video2Video ができるという事で試してみました

OpenMMLab の MMagic を使って超解像。え、たったの3行？

【StableDiffusionXLInstructPix2PixPipeline】ある画像に対して「写っている犬を猫に変えて」みたいなプロンプトで新しい画像が生成できる Instruct-Pix2Pix が SDXL に対応したのでさっそく使ってみました

Windowsで OpenMMLab の MMagic を使って Matting

Windowsで OpenMMLab の MMSegmentation v1.1.1 を使う

【SDXL 1.0】ControlNet と Inpaint を組み合わせると何ができるか？

【悪用厳禁】顔をすり替える Roop を Stable Diffusion Web UI の拡張機能としてではなく単独で動かす

GFPGANを使ってサクッと超解像【Windows】

MasaCtrl が一部 SDXL 1.0 (Stable Diffusion XL 1.0) に対応しています。さっそく試してみました。

【Diffusers】【StableDiffusionXLAdapterPipeline】SDXL 1.0 (Stable Diffusion XL 1.0) の T2I-Adapter が使えるようになりました

【SDXL 1.0】fuduki_mix を公開している人が新たに haduki_mix というモデルを公開してくれました

【SDXL 1.0】 Zoe-Depth ControlNet が Diffusers から公開されたのでさっそく使ってみました

「layered-neural-atlases」で「StableVideo」の事前準備を行う

「layered-neural-atlases」が動かせる環境をつくる

「StableVideo」という動画作成モデルがすごいです。AIによる動画作成がより実用的になった気がします。

SDXL 1.0 (Stable Diffusion XL 1.0) に使える T2I-Adapter-SDXL が公開されているので紹介します

【SDXL 1.0】Diffusers で ControlNet と LoRA が併用できるようになったのでさっそく使ってみました

二つのマイコンを無線で接続出来たらラジコン作りたくなりますよね？ということで作ってみました。３号機です。

Diffusersに新たに実装された GLIGEN って何？どういった事ができるの？

【SDXL 1.0】yayoi_mix を公開している人がSDXL派生の fuduki_mix というモデルを公開してくれています

【SDXL 1.0】Multi-ControlNetを使ってみる

ESP-WROOM-32同士をBluetoothで接続してシリアル通信を無線化する

【SDXL 1.0】 OpenPose ControlNet が公開されたのでさっそく使ってみました

【SDXL 1.0】 Depth ControlNet が Diffusers から公開されたのでさっそく使ってみました

【SDXL 1.0】LoRA学習 (DreamBooth fine-tuning via LoRA) の設定あれこれ

自前の画像でSDXL 1.0 (Stable Diffusion XL 1.0) のLoRA学習 (DreamBooth fine-tuning via LoRA) を行う