Stable Video Diffusion が Diffusers から使えるようになりました

動画生成 Image2Video

はじめにStable Diffusion を開発している Stability AI が公開した「Stable Video Diffusion」についての記事を以前書きました。 touch-sp.hatenablog.com 最近、Diffusersから使えるようになって環境構築など非常に簡単になりました。 github.com さっそく…

#Stable Video Diffusion

2023-11-30

Pythonのvenv環境をショートカットでactivateしたい（コマンドプロンプトとPowerShellの違い）

コマンドプロンプトを使う時とPowerShellを使う時で方法が異なります。はまった！！コマンドプロンプトショートカットのリンク先に以下のように書き込みます。 cmd.exe /k D:\diffusers\env\env1130\Scripts\activatePowerShell powershell.exe -ExecutionP…

2023-11-29

【 SDXL-Turbo 】num_inference_steps=1 で画像が生成できてしまう SDXL-Turbo を紹介します

画像生成

はじめにLCM-RoLAが短い時間で画像が生成できると話題になっていますが、それを上回るかもしれない SDXL-Turbo というのが Stable Diffusion を開発している Stability AI から公開されました。試しに使ってみました。また、LCM-LoRA と比較してみました。Py…

#SDXL-Turbo

2023-11-29

nagatsuki_mix v2.0 が公開されていたので使ってみました。

画像生成

はじめにnagatsuki_mix v1.0については以下を見て下さい。 touch-sp.hatenablog.com 今回はnagatsuki_mixのv1.0とv2.0の比較、nagatsuki_mix v2.0とLCM-LoRAの相性についてみてみました。v1.0とv2.0の比較左がv1.0、右がv2.0です。 nagatsuki_mix v2.0とLCM-…

2023-11-27

【C#】タブを使って複数のフォルダを一気に一つのエクスプローラーで開く

複数のフォルダを一気に開くC#コードを書きました。簡単にできるのかも知れませんがその方法が見つけられなかったので自分で作りました。C#コードあらかじめ「プロジェクト」→「参照の追加」からSystem.Windows.Formsを追加する必要があります。 using Syst…

2023-11-26

Windows の PowerShell で「zoxide」「fzf」を使う

インストール winget install ajeetdsouza.zoxide winget install fzf$profileの編集以下を書き込みます。 Invoke-Expression (& { (zoxide init powershell | Out-String) }) 書き込み方はVS codeがすでにインストールされていれば以下の1行です。 code $pr…

2023-11-26

Ubuntu 22.04 に PowerShell を導入する

Ubuntu22.04入門

インストールMicrosoft公式通りにやるとApplications一覧にアイコンが表示されません。起動は一旦Terminalを開いて「pwsh」とコマンドを入力する必要があります。面倒くさい！！ Ubuntu Softwareを通してインストールするとそのようなことにはなりませんで…

2023-11-25

Gradio と EasyOCR を使ってOCRアプリを作成する

OCR Gradio

結果わずか15行のスクリプトでOCRアプリが作成できました。同じことを以前 Streamlit を使ってやっています。 touch-sp.hatenablog.com その時は16行でした。 1行だけ短くなりました（笑）。Pythonスクリプト from PIL import ImageDraw import easyocr imp…

2023-11-25

Gradio に入門

Gradio

Gradioとは？公式サイトの説明文をDeepLで翻訳したのがこちらです。 Gradioは、機械学習モデルをデモする最速の方法であり、フレンドリーなウェブ・インターフェースを備えているため、誰でもどこでも使用することができます！サンプル１ import gradio as g…

2023-11-24

Stable Diffusion を開発している Stability AI が「Stable Video Diffusion」という image-to-videoモデルを公開しました

動画生成 Image2Video

github.com はじめに新しく公開された「Stable Video Diffusion」は image-to-videoモデルです。画像を一枚用意したらそれを動画化してくれます。環境二つの環境で動作確認しました。Windows 11 Windows 11 NVIDIA Drive 546.01 CUDA 11.8 Python 3.10Python…

#Stable Video Diffusion

2023-11-22

Diffusers から IP-Adapter が使えるようになったのでさっそく試してみました

画像生成

はじめにIP-Adapterに関してはこちらを参照して下さい。 touch-sp.hatenablog.com touch-sp.hatenablog.com 環境必要とするのはこれだけです。（PyTorchは自分の環境に合わせて変更して下さい） pip install torch==2.1.1+cu121 torchvision==0.16.1+cu121 -…

#IP-Adapter

2023-11-17

【Diffusers】AnimateDiff で Latent Consistency Model (LCM) が使えます

動画生成

はじめにLatent Consistency Model (LCM) は画像生成の高速化を可能にします。基本的な使い方は以前記事を書いたのでそちらを参照して下さい。 touch-sp.hatenablog.com AnimateDiff でも Latent Consistency Model (LCM) が使えるようなので動画生成の高速…

#AnimateDiff #Latent Consistency Model

2023-11-16

AnimateDiff が SDXL に対応したのでさっそく使ってみました。

動画生成

github.com 環境 Ubuntu 22.04 on WSL2 CUDA 12.1 Python 3.10 torch==2.1.1+cu121Python環境構築1行で済むようにrequirements.txtを作成しました。 pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/AnimateDiff_SDXL/req…

#AnimateDiff

2023-11-13

DiffBIR (Towards Blind Image Restoration with Generative Diffusion Prior) で画像復元

画像生成超解像

github.com はじめにDiffBIRはImage Restoration（画像復元）のためのモデルです。画像復元とSuper Resolution（超解像）との違いはよくわかっていません。どちらも低解像度の画像を綺麗にする手法です。結果最初に結果を示します。左の画像から右の画像が…

#DiffBIR

2023-11-11

【IP-Adapter】IP-Adapter-Face がアップデートされたのでさっそく使ってみました。

画像生成

github.com はじめに今回の目的は顔写真1枚からその人物の複数の画像を作成することです。環境 Windows 11 CUDA 11.7 Python 3.11pip install torch==2.0.1+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip ins…

#IP-Adapter

2023-11-10

少ないstep数で画像生成を可能にする Latent Consistency Model (LCM) を Diffusers から使う

画像生成

github.com 環境 Windows 11 CUDA 11.7 Python 3.10pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip install transformersモデルのダウンロードあらかじめ…

#Latent Consistency Model

2023-11-10

【Diffusers】「from_single_file」と「save_pretrained」を使うとsafetensorsファイルをDiffusersフォーマットに簡単に変換できます

画像生成

はじめに以前は「convert_original_stable_diffusion_to_diffusers.py」という実行ファイルを用いて変換していました。実は「from_single_file」と「save_pretrained」を使うと簡単にできることが分かりました。例 from diffusers import StableDiffusionPip…

2023-11-09

PixArt-alpha を Diffusers から使ってみる

画像生成

github.com 環境 Windows 11 CUDA 11.7 Python 3.10pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip install transformers omegaconf sentencepiece beaut…

#PixArt-alpha

2023-11-04

Diffusers から AnimateDiff が使えるようになりました

動画生成

github.com 動作環境動作確認できた環境です。必ずしもこれでなければいけないということはありません。Windows 11 Windows 11 CUDA 11.7 Python 3.10WSL2 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10環境構築CUDA 11.8の場合 pip install torch==2.0.1+cu1…

#AnimateDiff

2023-11-03

【LongerCrafter (FreeNoise)】LongerCrafter という動画作成モデルを試してみました

動画生成

github.com はじめに「LongerCrafter」は「FreeNoise」という方法を用いた動画生成モデルです。高品質の長い動画を生成することができるのが特徴とされています。さっそく試してみました。環境構築 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10 1行で環境構…

#LongerCrafter

パソコン関連もろもろ

2023-11-01から1ヶ月間の記事一覧

Stable Video Diffusion が Diffusers から使えるようになりました

Pythonのvenv環境をショートカットでactivateしたい（コマンドプロンプトとPowerShellの違い）

【 SDXL-Turbo 】num_inference_steps=1 で画像が生成できてしまう SDXL-Turbo を紹介します

nagatsuki_mix v2.0 が公開されていたので使ってみました。

【C#】タブを使って複数のフォルダを一気に一つのエクスプローラーで開く

Windows の PowerShell で「zoxide」「fzf」を使う

Ubuntu 22.04 に PowerShell を導入する

Gradio と EasyOCR を使ってOCRアプリを作成する

Gradio に入門

Stable Diffusion を開発している Stability AI が「Stable Video Diffusion」という image-to-videoモデルを公開しました

Diffusers から IP-Adapter が使えるようになったのでさっそく試してみました

【Diffusers】AnimateDiff で Latent Consistency Model (LCM) が使えます

AnimateDiff が SDXL に対応したのでさっそく使ってみました。

DiffBIR (Towards Blind Image Restoration with Generative Diffusion Prior) で画像復元

【IP-Adapter】IP-Adapter-Face がアップデートされたのでさっそく使ってみました。

少ないstep数で画像生成を可能にする Latent Consistency Model (LCM) を Diffusers から使う

【Diffusers】「from_single_file」と「save_pretrained」を使うとsafetensorsファイルをDiffusersフォーマットに簡単に変換できます

PixArt-alpha を Diffusers から使ってみる

Diffusers から AnimateDiff が使えるようになりました

【LongerCrafter (FreeNoise)】LongerCrafter という動画作成モデルを試してみました