【Diffusers】【ControlNet】【canny2image】画像サイズについて

画像生成 ControlNet

はじめにControlNetのcanny2imageについて深堀りしていきます。前回Canny法によるエッジ検出の設定が重要なことが分かりました。 touch-sp.hatenablog.com 今回は元画像が生成画像（今回は768x768とします）より大きい場合のリサイズについてです。リサイズ…

#ControlNet #canny2image

2023-03-02

【ControlNet】【canny2image】【Anything-V4】エッジ検出の違いで生成画像はどう変わるか？

画像生成 ControlNet

はじめに前回ControlNetのcanny2imageにおけるCanny法によるエッジ検出の設定について書きました。 touch-sp.hatenablog.com 実際に結果がどう変わるかをAnything-V4を使って検証しました。テーマは「手」をきれいに出力することです。元画像元画像はぱく…

#ControlNet #anything v4.0

2023-02-25

【Diffusers】DiffusersからMultiDiffusionを使ってみる（パノラマ画像が作れます）

画像生成

はじめにDiffusersからMultiDiffusion(Fusing Diffusion Paths for Controlled Image Generation)を使ってみました。横長や縦長の画像を作成可能です。デフォルトサイズは2048x512です。通常ならVRAM不足になりそうですがこちらを使うとVRAM使用量は少なく…

#Diffusers #MultiDiffusion

2023-02-23

ControlNet に Counterfeit-V2.5 や Healy's Anime Blend や Anything-V4 を組み合わせてみる

画像生成 ControlNet

最終更新日：2023年3月13日元画像元画像はぱくたそから使わせて頂きました。こちらの画像です。Counterfeit-V2.5結果canny2image 1024x1024手をきれいに出力するために1024x1024で作成しています。以下を記入した「prompt.txt」というテキストファイルを用…

#ControlNet #Counterfeit #canny2image

2023-02-22

【Counterfeit-V2.5】【Diffusers】VAEを使用して画質をよくする（暗い画像が明るくなります）

画像生成

最終更新日：2023年7月22日この記事の内容は古くなっています。最新情報はこちらを見てください。一応記事は残しておきます。左がそのままの画像、右が専用のVAEを適応した画像はじめにhuggingface.co Counterfeit-V2.5はDiffusersでそのまま使用できる形…

#Counterfeit #Diffusers

2023-02-19

【ControlNet】【canny2image】エッジ検出の設定をいじってみる

画像生成

はじめに以前「ControlNet」の「canny2image」と「pose2image」使い方を紹介しました。 touch-sp.hatenablog.com canny2image pose2image 今回は「canny2image」におけるエッジ検出の設定についていろいろ試してみました。といっても「low_threshold」と「h…

#ControlNet #canny2image

2023-02-17

pix2pix-zero（Zero-shot Image-to-Image Translation）を試してみる（Instruct-Pix2Pixとの比較）

画像生成

はじめにpix2pix-zero（Zero-shot Image-to-Image Translation）を使って写真に写る犬を猫に変えるというタスクに挑戦しました。 github.com 以前「Instruct-Pix2Pix」というのを使ったのでそちらとの比較になります。 touch-sp.hatenablog.com PC環境 Windo…

#pix2pix-zero

2023-02-17

【Diffusers】Attend and Exciteを使ってみる

画像生成

はじめにDiffusersからAttend and Excite（Attention-Based Semantic Guidance for Text-to-Image Diffusion Models）が使えるようになっていたのでさっそく使ってみました。 github.com 疑問点通常のStable Diffusionなどでは、複数のオブジェクトを生成す…

#Attend and Excite #Diffusers

2023-02-15

【ControlNet】【Windows】人物の姿勢を決める試み

画像生成

ControlNetのcanny2imageとpose2imageを使って人物の姿勢を決める試みを行いました。

#ControlNet #画像生成AI

2023-02-07

【Diffusers】Inpaintモデルのファインチューニング

画像生成

これでなにができる？環境構築実行はまりポイントその他これでなにができる？左の画像を右のように修正できるようになります。こちらをみて頂ければ効果が分かってもらえると思います。環境構築 Ubuntu 22.04 on WSL (Windows 11) CUDA 11.7.1 Python …

#Inpainting #Stable Diffusion #Diffusers

2023-02-05

【cloneofsimo/lora】LoRA(Low-Rank Adaptation)を試してみる

画像生成

はじめに以前、Diffusersを使ってLoRA(Low-Rank Adaptation)を試しました。 touch-sp.hatenablog.com 今回は本家のLoRAを使ってみます。 github.com 違いはtext encoderのファインチューンができる事とDiffusesモデルへの出力が簡単なことです。環境構築「bi…

#LoRA #Stable Diffusion

2023-02-03

【xFormers】DiffusersでDreamBoothを試す（VRAM 12GBでDreamBoothの実行は可能か？）

画像生成

公開日：2023年2月3日最終更新日：2023年2月13日はじめに環境構築設定 text encoderのファインチューニングなし text encoderのファインチューニングあり現時点での結論結果 text encoderのファインチューニングなし 400steps 800steps text encoderの…

#DreamBooth #Stable Diffusion #画像生成AI

2023-01-30

【Diffusers】DreamBoothとLoRA(Low-Rank Adaptation)って共存できるの？

画像生成

はじめに前回DreamBoothとLoRA(Low-Rank Adaptation)を別々に実行しました。 touch-sp.hatenablog.com 現在、Diffusersではtext encoderのファインチューニングができるLoRAは実装されていません。 github.com そこでDreamBoothでtext encoderのファインチュ…

#DreamBooth #LoRA #Stable Diffusion #画像生成AI #Diffusers

2023-01-27

【Diffusers】DreamBoothとLoRA(Low-Rank Adaptation)の比較（Stable Diffusion v1.4のファインチューニング）

画像生成

Diffusersを使ってDreamBoothとLoRA(Low-Rank Adaptation)の二つの方法でStable Diffusion v1.4をファインチューニングしました。比較のため二つの結果を残しておきます。

#DreamBooth #LoRA #Stable Diffusion #画像生成AI

2023-01-26

【DeepSpeed】DiffusersでDreamBoothを試す（DeepSpeedでどこまでVRAM消費を減らせるか）

画像生成

はじめに環境構築実験と結果 text encoderのファインチューニングなし no gradient_checkpointing, no set_grads_to_none with gradient_checkpointing, no set_grads_to_none no gradient_checkpointing, with set_grads_to_none with gradient_checkpoin…

#DreamBooth #Stable Diffusion #画像生成AI

2023-01-25

【Diffusers】Instruct-Pix2Pixを使ってみる（Paint-by-ExampleやInpaintingとの比較）

画像生成

最終更新日：2023年2月17日はじめに結果比較 Pythonスクリプト Instruct-Pix2Pix Paint-by-Example Stable-Diffusion-2-Inpainting 追記関連記事はじめに最近公開された「Instruct-Pix2Pix」をDiffusersから使ってみました。 huggingface.co 結果ベンチ…

#InstructPix2Pix #画像生成AI

2023-01-24

DiffusersでDreamBoothを試してみる（Stable Diffusion v1.4のファインチューニング）

画像生成

はじめに環境構築 PC環境 Python環境の構築 Pythonスクリプトのダウンロード設定 prior-preservation lossなし no use_8bit_adam no gradient_checkpointing, no set_grads_to_none with gradient_checkpointing, no set_grads_to_none no gradient_checkp…

#DreamBooth #Stable Diffusion #画像生成AI

2023-01-21

DiffusersでLoRA(Low-Rank Adaptation)を試してみる（Stable Diffusion v1.4のファインチューニング）

画像生成

DiffusersでLoRA(Low-Rank Adaptation of Large Language Models)を動かしてみました。使用したのはRTX 3080 VRAM 12GBです。

#Stable Diffusion #LoRA #Low-Rank Adaptation #Diffusers

2023-01-19

DiffusersでTextual Inversionを試してみる（Stable Diffusion v1.4のファインチューニング）

画像生成

はじめに環境構築 PC環境 Python環境の構築事前準備 Stable Diffusion v1.4のダウンロード Pythonスクリプトのダウンロード使用する画像のダウンロード実行学習推論公式チュートリアル参考にさせて頂いたサイトその他追記はじめにTextual Inversi…

#Textual Inversion #Stable Diffusion #画像生成AI

2023-01-16

【Counterfeit-V2.0】いらすとやの画像を加工してみる part 2-4

画像生成

はじめにいろいろなモデルで画像加工を行っています。注目点はペンを持つ右手の指の描写です。今回はCounterfeit-V2.0というのを使わせて頂きました。strengthを0.9と高く設定しても元画像の印象を残す傾向にあるように感じました。今回の結果（Counterfeit-…

#画像生成AI #Counterfeit

2023-01-13

【Anything V3】いらすとやの画像を加工してみる part 2-3

画像生成

今回の結果（Anything V3）前々回（waifu diffusion v1.4）の結果記事はこちらです。前回の結果（dreamlike-photoreal-2.0）記事はこちらです。追記2023年1月末に再アップロードされて全体的に暗い画像になる問題が改善しています。 [:256]

#anything v3.0 #画像生成AI

2023-01-12

【Dreamlike Photoreal 2.0】いらすとやの画像を加工してみる part 2-2

画像生成

前回（waifu diffusion）の結果記事はこちらです。今回の結果（dreamlike-photoreal-2.0） dreamlike-artが公開してくれているdreamlike-photoreal-2.0のimg2imgをdiffusersから実行してみました。 huggingface.co 指の描写を含めて非常にきれいにできまし…

#dreamlike photoreal 2.0 #画像生成AI

2023-01-10

【Waifu Diffusion v1.4】いらすとやの画像を加工してみる part 2

画像生成

はじめに prompt prompt negative prompt パラメーター strength seed guidance_scale 結果はじめに前回はstable-diffusion-2-depthを使ってイラストを加工しました。 touch-sp.hatenablog.com 今回はwaifu diffusionを使ってみます。画像を大量に生成する…

#画像生成AI #Waifu Diffusion

2023-01-08

Stable Diffusion派生モデルをDiffusersから使う

画像生成

最終更新日：2023年8月11日この記事の内容は古くなっています。「from_single_file」を使うとこの記事にあるような変換は不要です。こちらを参照して下さい。一応古くなった記事も残しておきます。はじめに環境方法 ckptファイルのダウンロード YAML…

#画像生成AI #Stable Diffusion #Diffusers

2023-01-07

【inpainting】従来のGAN（AOT-GAN）とPaintByExampleを比較してみる

画像生成

はじめに結果 AOT-GANの使い方環境 Pythonスクリプト実行はじめに以前PaintByExampleというのを使って画像から犬を消しました。 touch-sp.hatenablog.com 今回はAOT-GANで同じことをやって結果を比較してみました。 AOT-GANはOpenMMLabのMMEditingから使…

#inpainting #PaintByExample #AOT-GAN #OpenMMLab #MMEdit

2023-01-06

【stable-diffusion-2-depth】いらすとやの画像を加工してみる

画像生成

はじめに手順１手順２１（一番最初） prompt negative prompt 結果２（「portrait of」を足してみる） prompt negative prompt 結果３（「photorealistic」を足してみる）４（「octane render」を足してみる）５（「diffused natural skin glow」を足…

#Stable Diffusion 2.1 #画像生成AI

2023-01-04

【Waifu Diffusion v1.4】【img2img】元画像（写真）を再現して新しい画像を生成する

画像生成

公開日：2023年1月4日最終更新日：2023年1月22日はじめに動作環境方法手順０手順１（「prompt」について） prompt negative prompt 手順２（「strength」について）手順３（「guidance_scale」について）手順４（「seed」をいろいろ変えてみる）手…

#Waifu Diffusion #Waifu Diffusion1.4 #画像生成AI

2023-01-03

【Waifu Diffusion v1-3-5】今さらですがWaifu Diffusionってすごいですね

画像生成

はじめに元画像 prompt（呪文） prompt negative prompt 結果 Pythonスクリプト感想追記（v1-4） prompt negative prompt パラメーターはじめに前回の続きです。 touch-sp.hatenablog.com 「waifu-diffusion-v1-3-5」がdiffusersから使えるようになって…

#画像生成AI #Waifu Diffusion

2023-01-02