C#を使ってシンボリックリンクの作成を簡略化する

C#

using System; using System.Diagnostics; using System.IO; using System.Windows.Forms; namespace make_simlink { public partial class Form1 : Form { public Form1() { InitializeComponent(); } private void button1_Click(object sender, EventArgs…

#シンボリックリンク

2023-12-28

【Diffusers】AnimateDiff + Multi-ControlNet で作成する動画のフレーム数上限を上げる方法

動画生成

はじめにこちらの続きです。 touch-sp.hatenablog.com この記事ではフレーム数上限は32だと書きました。その上限を上げる方法が見つかったので紹介します。方法こちらの記事で「convert_animatediff_motion_module_to_diffusers.py」を使ってモーションモジ…

#AnimateDiff

2023-12-27

【AnimateDiff】Diffusers用にモーションモジュールを変換するスクリプトが公開されたので Diffusers から AnimateDiff v3 が使えるようになりました。

動画生成

変換用スクリプトファイル名は「convert_animatediff_motion_module_to_diffusers.py」です。こちらのスクリプトです。 github.com 変換方法 python convert_animatediff_motion_module_to_diffusers.py ` --ckpt_path v3_sd15_mm.ckpt ` --use_motion_mid_b…

#AnimateDiff

2023-12-23

【OpenAI/Whisper】日本語音声の文字起こしをする際に専門用語に弱い点を克服する方法。

文字起こし

はじめに large-v2とlarge-v3の比較 large-v2 Pythonスクリプト「run.py」実行結果 large-v3 Pythonスクリプト「run.py」実行結果ここから本題 Pythonスクリプト「run.py」実行結果はじめにWhisperにlarge-v3という新しいモデルが追加されていたので…

#Whisper

2023-12-21

【ToDo】最近気になるサイト

試してみたいけどまだ試していないもの、コードがまだ公開されていないものなどです。進歩が速すぎてなかなか追いつけません。画像生成github.com github.com 動画生成github.com github.com github.com github.com すでに試してみたものLongAnimateDiffgit…

2023-12-19

「fuduki_mix v2.0」が公開されています。過去のモデルと比較してみました。

画像生成

結果左から v1.0 → v1.5 → v2.0 です。今回使用したプロンプトでは、キリっとしたかっこいい女性から綺麗な女性に変わってきている気がします。Pythonスクリプトプロンプトはこちらからそのまま使わせてもらいました。 from diffusers import DiffusionPipe…

2023-12-18

【AnimateAnyghing】AnimateAnyghing を使って Image2Videoを試してみる

動画生成 Image2Video

github.com はじめに以前AnimateDiff Motion Module v3 と SparseCtrl を使って同じことをしました。 touch-sp.hatenablog.com AnimateAnyghingでは変化させたくない部分をそのまま残せます。その点が前回との違いになります。元画像用意した1枚の画像に動き…

#AnimateAnyghing

2023-12-17

【AnimateDiff】Motion Module v3 と SparseCtrl で Image2Video を試してみる

動画生成 Image2Video

元画像用意した1枚の画像に動きを持たせることが目的です。以下のスクリプトで作成しました。 from diffusers import StableDiffusionPipeline, EulerAncestralDiscreteScheduler import torch from compel import Compel, DiffusersTextualInversionManage…

#AnimateDiff #SparseCtrl

2023-12-16

【AnimateDiff】Motion Module v3 が公開されたので v2 と比較してみました。

動画生成

はじめにv2はこちらを見てください。 touch-sp.hatenablog.com v2と全く同じ環境で動作可能でした。YAMLファイル以下のようなYAMLファイルを用意しました。 # 1-animation - adapter_lora_path: "models/Motion_Module/v3_sd15_adapter.ckpt" dreambooth_pat…

#AnimateDiff

2023-12-15

【Diffusers】SDE Drag Pipeline の紹介。女性の髪を伸ばしてみました。

画像生成

はじめに以前「DragGAN」について記事を書きました。 touch-sp.hatenablog.com 「DragGAN」はGAN（敵対的生成ネットワーク）を使っています。今回紹介する「SDE Drag」は拡散モデルを使ったものになります。目的以下の女性の髪を伸ばしてみます。この女性…

#SDE Drag

2023-12-14

動画の質を向上させる FreeInit を紹介します。

動画生成

github.com はじめに公式ページそのまま We propose FreeInit, a concise yet effective method to improve temporal consistency of videos generated by diffusion models. FreeInit requires no additional training and introduces no learnable paramet…

#AnimateDiff #FreeInit

2023-12-13

【Diffusers】AnimateDiff + Multi-ControlNet + IP-Adapterで動画作成してみる

動画生成

目的この女性が歩く動画（アニメ調）を作っていきます。この女性の写真はこちらで作成したものです。 touch-sp.hatenablog.com walking動画walking動画はPixabayからこちらの動画を使わせて頂きました。結果LCM-LoRAなしなんとなく顔は似ているような気が…

#AnimateDiff #IP-Adapter #ControlNet

2023-12-12

「haduki_mix v1.6 typeK」というモデルが公開されています。過去のモデルと比較してみました。

画像生成

疑問「typeK」とはどういう意味なのでしょうか？結果左から v1.0 → v1.5 → v1.6 typeK です。 Pythonスクリプトプロンプトはこちらからそのまま使わせてもらいました。 from diffusers import StableDiffusionXLPipeline, DPMSolverMultistepScheduler impor…

2023-12-09

【Diffusers】AnimateDiff + Multi-ControlNet で動画作成してみる

動画生成

はじめに以前、単一のControlNetを使う場合の記事を書きました。 touch-sp.hatenablog.com 新たにMulti-ControlNetに挑戦しました。はまりポイント最大32フレームまでしか対応していないようです。それ以上の動画を作ろうとするとエラーがでます。 RuntimeEr…

#AnimateDiff #ControlNet #Multi-ControlNet

2023-12-09

【controlnet_aux】動画に対してControlNet用のPreprocessを行う

はじめに以前複数の画像に対してまとめてControlNet用のPreprocessを行う方法を書きました。 touch-sp.hatenablog.com 今回は動画を対象としました。さらにGIFでも出力できるようにしました。Pythonスクリプト import cv2 from PIL import Image import os …

2023-12-08

【Diffusers】AnimateDiff + IP-Adapter で動画作成してみる

動画生成

IP-Adapter用の画像を作成まずは「yabalMixTrue25D」というモデルを使って女性の画像を作成しました。なんとなく作ったのですが手の描写が完璧すぎて驚きました。 from diffusers import DiffusionPipeline, DPMSolverMultistepScheduler, AutoencoderKL pi…

#AnimateDiff #IP-Adapter

2023-12-08

【Diffusers】AnimateDiff + ControlNet で動画作成してみる

動画生成

はじめに最近DiffusersのAnimateDiffでControlNetが使えるようになりました。さっそく使ってみました。環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 --index-url https://download.pytor…

#AnimateDiff #ControlNet

2023-12-07

MagicAnimate で使用できる DensePoseモーション動画を作成する

動画生成

環境 Ubuntu 22.04 on WSL2 CUDA 11.7 or 11.8 Python 3.10方法① Python環境構築動画作成後にMagicAnimateを使うことを想定して環境構築します。たったの2行です。 pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/magic-…

#MagicAnimate #magic-animate #DensePose

2023-12-06

巷でうわさの「MagicAnimate」を使ってみました

動画生成

github.com 環境環境構築 CUDA 11.7の場合 CUDA 11.8の場合準備実行（GUIなし） YAMLファイルの作成実行実行（Gradio：GUIあり）続き環境 Ubuntu 22.04 on WSL2 CUDA 11.7 or 11.8 Python 3.10Python 3.10以外でも動くと思いますが確認はできていませ…

#MagicAnimate #magic-animate

2023-12-05

【controlnet_aux】複数の画像に対してまとめてControlNet用のPreprocessを行う

はじめにcontrolnet-auxというライブラリを使って複数の画像に対してまとめてControlNet用のPreprocessを行うスクリプトを書きました。controlnet-auxについては以下を見て下さい。 touch-sp.hatenablog.com Pythonスクリプト from PIL import Image import …

2023-11-30

Stable Video Diffusion が Diffusers から使えるようになりました

動画生成 Image2Video

はじめにStable Diffusion を開発している Stability AI が公開した「Stable Video Diffusion」についての記事を以前書きました。 touch-sp.hatenablog.com 最近、Diffusersから使えるようになって環境構築など非常に簡単になりました。 github.com さっそく…

#Stable Video Diffusion

2023-11-30

Pythonのvenv環境をショートカットでactivateしたい（コマンドプロンプトとPowerShellの違い）

コマンドプロンプトを使う時とPowerShellを使う時で方法が異なります。はまった！！コマンドプロンプトショートカットのリンク先に以下のように書き込みます。 cmd.exe /k D:\diffusers\env\env1130\Scripts\activatePowerShell powershell.exe -ExecutionP…

2023-11-29

【 SDXL-Turbo 】num_inference_steps=1 で画像が生成できてしまう SDXL-Turbo を紹介します

画像生成

はじめにLCM-RoLAが短い時間で画像が生成できると話題になっていますが、それを上回るかもしれない SDXL-Turbo というのが Stable Diffusion を開発している Stability AI から公開されました。試しに使ってみました。また、LCM-LoRA と比較してみました。Py…

#SDXL-Turbo

2023-11-29

nagatsuki_mix v2.0 が公開されていたので使ってみました。

画像生成

はじめにnagatsuki_mix v1.0については以下を見て下さい。 touch-sp.hatenablog.com 今回はnagatsuki_mixのv1.0とv2.0の比較、nagatsuki_mix v2.0とLCM-LoRAの相性についてみてみました。v1.0とv2.0の比較左がv1.0、右がv2.0です。 nagatsuki_mix v2.0とLCM-…

2023-11-27

【C#】タブを使って複数のフォルダを一気に一つのエクスプローラーで開く

複数のフォルダを一気に開くC#コードを書きました。簡単にできるのかも知れませんがその方法が見つけられなかったので自分で作りました。C#コードあらかじめ「プロジェクト」→「参照の追加」からSystem.Windows.Formsを追加する必要があります。 using Syst…

2023-11-26

Windows の PowerShell で「zoxide」「fzf」を使う

インストール winget install ajeetdsouza.zoxide winget install fzf$profileの編集以下を書き込みます。 Invoke-Expression (& { (zoxide init powershell | Out-String) }) 書き込み方はVS codeがすでにインストールされていれば以下の1行です。 code $pr…

2023-11-26

Ubuntu 22.04 に PowerShell を導入する

Ubuntu22.04入門

インストールMicrosoft公式通りにやるとApplications一覧にアイコンが表示されません。起動は一旦Terminalを開いて「pwsh」とコマンドを入力する必要があります。面倒くさい！！ Ubuntu Softwareを通してインストールするとそのようなことにはなりませんで…

2023-11-25

Gradio と EasyOCR を使ってOCRアプリを作成する

OCR Gradio

結果わずか15行のスクリプトでOCRアプリが作成できました。同じことを以前 Streamlit を使ってやっています。 touch-sp.hatenablog.com その時は16行でした。 1行だけ短くなりました（笑）。Pythonスクリプト from PIL import ImageDraw import easyocr imp…

2023-11-25

Gradio に入門

Gradio

Gradioとは？公式サイトの説明文をDeepLで翻訳したのがこちらです。 Gradioは、機械学習モデルをデモする最速の方法であり、フレンドリーなウェブ・インターフェースを備えているため、誰でもどこでも使用することができます！サンプル１ import gradio as g…

2023-11-24

Stable Diffusion を開発している Stability AI が「Stable Video Diffusion」という image-to-videoモデルを公開しました

動画生成 Image2Video

github.com はじめに新しく公開された「Stable Video Diffusion」は image-to-videoモデルです。画像を一枚用意したらそれを動画化してくれます。環境二つの環境で動作確認しました。Windows 11 Windows 11 NVIDIA Drive 546.01 CUDA 11.8 Python 3.10Python…

#Stable Video Diffusion

パソコン関連もろもろ

2023-01-01から1年間の記事一覧

C#を使ってシンボリックリンクの作成を簡略化する

【Diffusers】AnimateDiff + Multi-ControlNet で作成する動画のフレーム数上限を上げる方法

【AnimateDiff】Diffusers用にモーションモジュールを変換するスクリプトが公開されたので Diffusers から AnimateDiff v3 が使えるようになりました。

【OpenAI/Whisper】日本語音声の文字起こしをする際に専門用語に弱い点を克服する方法。

【ToDo】最近気になるサイト

「fuduki_mix v2.0」が公開されています。過去のモデルと比較してみました。

【AnimateAnyghing】AnimateAnyghing を使って Image2Videoを試してみる

【AnimateDiff】Motion Module v3 と SparseCtrl で Image2Video を試してみる

【AnimateDiff】Motion Module v3 が公開されたので v2 と比較してみました。

【Diffusers】SDE Drag Pipeline の紹介。女性の髪を伸ばしてみました。

動画の質を向上させる FreeInit を紹介します。

【Diffusers】AnimateDiff + Multi-ControlNet + IP-Adapterで動画作成してみる

「haduki_mix v1.6 typeK」というモデルが公開されています。過去のモデルと比較してみました。

【Diffusers】AnimateDiff + Multi-ControlNet で動画作成してみる

【controlnet_aux】動画に対してControlNet用のPreprocessを行う

【Diffusers】AnimateDiff + IP-Adapter で動画作成してみる

【Diffusers】AnimateDiff + ControlNet で動画作成してみる

MagicAnimate で使用できる DensePoseモーション動画を作成する

巷でうわさの「MagicAnimate」を使ってみました

【controlnet_aux】複数の画像に対してまとめてControlNet用のPreprocessを行う

Stable Video Diffusion が Diffusers から使えるようになりました

Pythonのvenv環境をショートカットでactivateしたい（コマンドプロンプトとPowerShellの違い）

【 SDXL-Turbo 】num_inference_steps=1 で画像が生成できてしまう SDXL-Turbo を紹介します

nagatsuki_mix v2.0 が公開されていたので使ってみました。

【C#】タブを使って複数のフォルダを一気に一つのエクスプローラーで開く

Windows の PowerShell で「zoxide」「fzf」を使う

Ubuntu 22.04 に PowerShell を導入する

Gradio と EasyOCR を使ってOCRアプリを作成する

Gradio に入門

Stable Diffusion を開発している Stability AI が「Stable Video Diffusion」という image-to-videoモデルを公開しました