2023-11-01から1ヶ月間の記事一覧

Stable Video Diffusion が Diffusers から使えるようになりました

はじめにStable Diffusion を開発している Stability AI が公開した「Stable Video Diffusion」についての記事を以前書きました。 touch-sp.hatenablog.com 最近、Diffusersから使えるようになって環境構築など非常に簡単になりました。 github.com さっそく…

Pythonのvenv環境をショートカットでactivateしたい(コマンドプロンプトとPowerShellの違い)

コマンドプロンプトを使う時とPowerShellを使う時で方法が異なります。 はまった!!コマンドプロンプトショートカットのリンク先に以下のように書き込みます。 cmd.exe /k D:\diffusers\env\env1130\Scripts\activatePowerShell powershell.exe -ExecutionP…

【 SDXL-Turbo 】num_inference_steps=1 で画像が生成できてしまう SDXL-Turbo を紹介します

はじめにLCM-RoLAが短い時間で画像が生成できると話題になっていますが、それを上回るかもしれない SDXL-Turbo というのが Stable Diffusion を開発している Stability AI から公開されました。試しに使ってみました。また、LCM-LoRA と比較してみました。Py…

nagatsuki_mix v2.0 が公開されていたので使ってみました。

はじめにnagatsuki_mix v1.0については以下を見て下さい。 touch-sp.hatenablog.com 今回はnagatsuki_mixのv1.0とv2.0の比較、nagatsuki_mix v2.0とLCM-LoRAの相性についてみてみました。v1.0とv2.0の比較左がv1.0、右がv2.0です。 nagatsuki_mix v2.0とLCM-…

【C#】タブを使って複数のフォルダを一気に一つのエクスプローラーで開く

複数のフォルダを一気に開くC#コードを書きました。 簡単にできるのかも知れませんがその方法が見つけられなかったので自分で作りました。C#コードあらかじめ「プロジェクト」→「参照の追加」からSystem.Windows.Formsを追加する必要があります。 using Syst…

Windows の PowerShell で「zoxide」「fzf」を使う

インストール winget install ajeetdsouza.zoxide winget install fzf$profileの編集以下を書き込みます。 Invoke-Expression (& { (zoxide init powershell | Out-String) }) 書き込み方はVS codeがすでにインストールされていれば以下の1行です。 code $pr…

Ubuntu 22.04 に PowerShell を導入する

インストールMicrosoft公式通りにやるとApplications一覧にアイコンが表示されません。 起動は一旦Terminalを開いて「pwsh」とコマンドを入力する必要があります。 面倒くさい!! Ubuntu Softwareを通してインストールするとそのようなことにはなりませんで…

Gradio と EasyOCR を使ってOCRアプリを作成する

結果わずか15行のスクリプトでOCRアプリが作成できました。 同じことを以前 Streamlit を使ってやっています。 touch-sp.hatenablog.com その時は16行でした。 1行だけ短くなりました(笑)。Pythonスクリプト from PIL import ImageDraw import easyocr imp…

Gradio に入門

Gradioとは?公式サイトの説明文をDeepLで翻訳したのがこちらです。 Gradioは、機械学習モデルをデモする最速の方法であり、フレンドリーなウェブ・インターフェースを備えているため、誰でもどこでも使用することができます!サンプル1 import gradio as g…

Stable Diffusion を開発している Stability AI が「Stable Video Diffusion」という image-to-videoモデルを公開しました

github.com はじめに新しく公開された「Stable Video Diffusion」は image-to-videoモデルです。画像を一枚用意したらそれを動画化してくれます。環境二つの環境で動作確認しました。Windows 11 Windows 11 NVIDIA Drive 546.01 CUDA 11.8 Python 3.10Python…

Diffusers から IP-Adapter が使えるようになったのでさっそく試してみました

はじめにIP-Adapterに関してはこちらを参照して下さい。 touch-sp.hatenablog.com touch-sp.hatenablog.com 環境必要とするのはこれだけです。(PyTorchは自分の環境に合わせて変更して下さい) pip install torch==2.1.1+cu121 torchvision==0.16.1+cu121 -…

【Diffusers】AnimateDiff で Latent Consistency Model (LCM) が使えます

はじめにLatent Consistency Model (LCM) は画像生成の高速化を可能にします。基本的な使い方は以前記事を書いたのでそちらを参照して下さい。 touch-sp.hatenablog.com AnimateDiff でも Latent Consistency Model (LCM) が使えるようなので動画生成の高速…

AnimateDiff が SDXL に対応したのでさっそく使ってみました。

github.com 環境 Ubuntu 22.04 on WSL2 CUDA 12.1 Python 3.10 torch==2.1.1+cu121Python環境構築1行で済むようにrequirements.txtを作成しました。 pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/AnimateDiff_SDXL/req…

DiffBIR (Towards Blind Image Restoration with Generative Diffusion Prior) で画像復元

github.com はじめにDiffBIRはImage Restoration(画像復元)のためのモデルです。画像復元とSuper Resolution(超解像)との違いはよくわかっていません。どちらも低解像度の画像を綺麗にする手法です。結果最初に結果を示します。 左の画像から右の画像が…

【IP-Adapter】IP-Adapter-Face がアップデートされたのでさっそく使ってみました。

github.com はじめに今回の目的は顔写真1枚からその人物の複数の画像を作成することです。環境 Windows 11 CUDA 11.7 Python 3.11pip install torch==2.0.1+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip ins…

少ないstep数で画像生成を可能にする Latent Consistency Model (LCM) を Diffusers から使う

github.com 環境 Windows 11 CUDA 11.7 Python 3.10pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip install transformersモデルのダウンロードあらかじめ…

【Diffusers】「from_single_file」と「save_pretrained」を使うとsafetensorsファイルをDiffusersフォーマットに簡単に変換できます

はじめに以前は「convert_original_stable_diffusion_to_diffusers.py」という実行ファイルを用いて変換していました。実は「from_single_file」と「save_pretrained」を使うと簡単にできることが分かりました。例 from diffusers import StableDiffusionPip…

PixArt-alpha を Diffusers から使ってみる

github.com 環境 Windows 11 CUDA 11.7 Python 3.10pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 --index-url https://download.pytorch.org/whl/cu117 pip install diffusers[torch] pip install transformers omegaconf sentencepiece beaut…

Diffusers から AnimateDiff が使えるようになりました

github.com 動作環境動作確認できた環境です。必ずしもこれでなければいけないということはありません。Windows 11 Windows 11 CUDA 11.7 Python 3.10WSL2 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10環境構築CUDA 11.8の場合 pip install torch==2.0.1+cu1…

【LongerCrafter (FreeNoise)】LongerCrafter という動画作成モデルを試してみました

github.com はじめに「LongerCrafter」は「FreeNoise」という方法を用いた動画生成モデルです。高品質の長い動画を生成することができるのが特徴とされています。さっそく試してみました。環境構築 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10 1行で環境構…