【Image2Video】【Diffusers】PIA（Personalized Image Animator）+ FreeInit で動画を作成

動画生成 Image2Video

はじめにDiffusersからPIA（Personalized Image Animator）とFreeInitを使ってImage2Videoを行いました。一枚の画像から動画を作成しています。用意した画像結果 Pythonスクリプトさまざまな組み合わせで実行しました。このスクリプトで一気に18通りの動画…

#PIA #FreeInit

2024-01-30

【Diffusers】multiple IP-Adapters で遊んでみた

画像生成

はじめに1枚の顔写真からアニメ風画像を作成することが目的です。前回PhotoMakerというものを使って同様のことをしました。 touch-sp.hatenablog.com 今回はmultiple IP-Adaptersを使ってみました。結果左の画像から右の画像を作成しました。よーく見ると、…

#IP-Adapter

2024-01-29

PhotoMaker と modernDisneyXL で遊んでみた

画像生成

目的1枚の顔写真からディズニー風画像を作成することが目的です。結果ただのImage2imageではないです。左の画像から右の画像を作成しました。よーく見ると、なんとなく特徴を捉えているような気もします。どうでしょう？ Pythonスクリプト import torch fro…

#PhotoMaker

2024-01-28

【Face LoRA（顔LoRA）】LoRAにPivotal Tuningを組み合わせて特定の顔を学習させてみました。

画像生成

結果学習に使用した画像の一部を下に載せておきます。この人物を再現しようとしたのが上記画像です。再現できていると言えるでしょうか？はじめにLoRA自体は以前からある手法です。それにPivotal Tuningを組み合わせる方法が公開されたのはごく最近です…

#LoRA #Pivotal Tuning

2024-01-28

IP-Adapter-FaceID-PlusV2 で同一人物の写真が何枚も作れるのでLoRA学習用データをつくってみました。

画像生成

はじめに「IP-Adapter-FaceID-PlusV2」を使うと1枚の顔写真からその人物の写真を何枚も作成することが可能になります。 touch-sp.hatenablog.com 顔の再現性は完璧ではありません。しかし、作成する画像の一貫性は高いです。実例を見た方がわかりやすです…

#LoRA #IP-Adapter

2024-01-26

【Video2Video】Diffusers で AnimateDiffVideoToVideoPipeline というのが公開されていたので AnimateDiff v2 と v3 で実行してみました。

動画生成

PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.1.2+cu118 --index-url https://download.pytorch.org/whl/cu118 pip install git+https://github.com/huggingface/diffusers pip install accelerate transformers準備こちら…

#AnimateDiff

2024-01-24

【InstantID】IP-Adapter と ControlNet を使った顔写真のスタイル変換

github.com 目的一枚の顔写真に対してスタイル変換を行います。実行準備モデルはGitHubリポジトリに記載されている通りにダウンロードしました。こちらから「pipeline_stable_diffusion_xl_instantid.py」をダウンロードしました。実行「run.py」は後述する…

#InstantID

2024-01-22

IP‐Adapter‐Faceについての記事をまとめました。

はじめにIP-Adapter-Faceに関する記事を何個か書いたのですが、ばらばらに散らばっているのでまとめました。IP-Adapter-Faceにはこのようなモデルがあります。「IP-Adapter-Plus-Face」「IP-Adapter-Full-Face」「IP-Adapter-FaceID」「IP-Adapter-FaceI…

#IP-Adapter

2024-01-19

【PySide6】ドラッグ&ドロップでファイルやフォルダのアドレスを入力できる QLineEdit （または QTextEdit）を作成しました

Ubuntu22.04入門 PySide6

たったこれだけです。 class Lineedit_allow_drag(QLineEdit): def __init__(self): super().__init__() self.setDragEnabled(True) def dragEnterEvent(self, e): if(e.mimeData().hasUrls()): e.accept() def dropEvent(self, e): urls = e.mimeData().url…

2024-01-19

【Ubuntu】PySide6を使う

Ubuntu22.04入門 PySide6

はじめにUbuntu 22.04でPySide6を使おうとするとエラーが出ました。エラー表示 qt.qpa.plugin: From 6.5.0, xcb-cursor0 or libxcb-cursor0 is needed to load the Qt xcb platform plugin. qt.qpa.plugin: Could not load the Qt platform plugin "xcb" in …

2024-01-18

Ubuntu 24.04で日本語入力を可能にする方法

Ubuntu 24.04

はじめに公開前のUbuntu 24.04を導入しました。 touch-sp.hatenablog.com ファイル名やメニューを英語にしたいので言語を英語に設定してインストールしました。そのままでは日本語入力ができないのですが、以下の設定で入力可能になります。方法「Settings…

2024-01-18

【IP-Adapter】SDXL用の IP-Adapter-FaceID-PlusV2 が公開されたので以前のモデルと比較してみました。

画像生成

はじめについ先日、SDXL用のIP-Adapter-FaceIDを紹介したばかりです。 touch-sp.hatenablog.com にもかかわらず新たにIP-Adapter-FaceID-PlusV2が公開されました。驚くべき開発スピードです。さっそく使ってみて以前のモデルと比較してみました。目的1枚の…

#IP-Adapter

2024-01-18

【Diffusers】AnimateDiff + FreeInit が Diffusers から使えるようになりました。

動画生成

はじめに以前「FreeInit」についての記事を書きました。 touch-sp.hatenablog.com Diffusersから使えるようになって環境設定、使い方など非常に簡単になっています。PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.1.2+cu118 …

#AnimateDiff #FreeInit

2024-01-17

【PhotoMaker】人物写真をカスタマイズできる PhotoMaker を使ってみました。

画像生成

github.com はじめに「PhotoMaker」をつかえば色々人物写真をカスタマイズできるようですが、今回は1枚の写真から同一人物の写真を作成してみます。以前「IP-Adapter」を使って同様のことをしています。 touch-sp.hatenablog.com touch-sp.hatenablog.com 用…

#PhotoMaker

2024-01-17

Pythonを使って写真に写る顔を切り取る方法（【face-alignment】と【dlib】）

はじめにPythonを使って写真に写る顔を切り取る方法を二つ紹介します。元画像こちらの画像を使わせて頂きました。【face-alignment】を使う方法結果 PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.1.2+cu118 --index-url ht…

2024-01-16

【Diffusers】Diffusers から IP-Adapter FaceID が使えるようになりました。

画像生成

はじめにタイトルにある通りです。Diffusersから直接使う場合、環境構築が非常に楽になります。「FaceID-Plus」と「FaceID-PlusV2」については別記事にしています。 touch-sp.hatenablog.com PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip ins…

#IP-Adapter

2024-01-13

【Diffusers】【Inpaint】StableDiffusionInpaintPipeline と MaskedStableDiffusionImg2ImgPipeline の違いを比較してみました。

画像生成

はじめにInpaintは画像の一部修正をすることです。Inpaint専用モデルもありますが、今回は通常のText2Imageモデルを使用してInpaintを行います。「yabalMixTrue25D_v5」というモデルを使用しました。使い方が2通りあるので、両方を実行して比較してみました…

#Inpaint

2024-01-13

【Moore-AnimateAnyone】1枚の画像とポーズ動画から動画を作成する

動画生成

github.com はじめに本家の「AnimateAnyone」はこちらです。 github.com 本家のサイトではスクリプトや学習済みパラメーターが公開されていません。今回使用した「Moore-AnimateAnyone」はレポートを参考に作者なりに本家に近づくように作成したモデルのよ…

#AnimateAnyone #Moore-AnimateAnyone

2024-01-12

【IP-Adapter】IP-Adapter と Inpaintモデルを組み合わせれば写真に写る人物の顔を好みの顔に変えられる？

画像生成

この写真に写る女性の顔をこの顔に変えられるかどうか試してみました。実行するにあたりこのようなマスク画像を用意しました。結果Diffusersを使って実行しています。 DiffusersではFaceIDがまだ使えないのでそれ以前のIP-Adapterで試してます。ip-adapter…

#IP-Adapter

2024-01-11

【IP-Adapter】SDXL用の IP-Adapter-FaceID が公開されていたのでさっそく使ってみました。

PC環境 Python環境構築結果用意した画像今回作成した画像 Pythonスクリプト補足１補足２補足３ PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.0.1+cu118 --index-url https://download.pytorch.org/whl/cu118 pip inst…

#IP-Adapter

2024-01-10

Diffusersでは「DPM++2M SDE Karras」がうまく機能していなかったらしい

画像生成

2024年2月１日追記この問題はDiffusers v0.26.0以降修正されています。はじめにタイトルにある通りです。たしかにノイズが多いなとの印象はありましたが、そんなもんだと思っていました。その都度GFPGANやRefinerを使ってノイズ除去を行ってきました。一時的…

2024-01-10

【Video2Video】「Rerender A Video」がDiffusersから使えるようになっていたのでさっそく使ってみました。

動画生成 Video2Video

はじめに以前「Rerender A Video」の記事を書きました。 touch-sp.hatenablog.com 今回、新たにDiffusersから使えるようになったのでさっそく試してみました。 Video2Videoに関しては「AnimateDiff」と同等、またはそれ以上の結果が得られました。「Animate…

#Rerender A Video

2024-01-09

【Image2Video】PIA（Personalized Image Animator）を使って動画を作成してみました

動画生成 Image2Video

github.com はじめにPIAはAnimateDiffを使ったImage2Videoです。1枚の画像とプロンプトから動画を作成できます。PC環境 Windows 11 CUDA 11.8 Python 3.10Python環境構築「requirements.txt」を作成したので環境構築は以下の1行です。 pip install -r https:…

#PIA

2024-01-08

開発中のUbuntu 24.04を使用してみた（2024年1月）

Ubuntu 24.04

はじめにUbuntu 24.04は名前の通り2024年4月に公開予定です。当然まだ開発途中ですが、開発中のものが使用可能なのでさっそく使ってみました。2023年10月にUbuntuに入門したばかりですが・・・。 touch-sp.hatenablog.com 使用する方法はisoファイルをダウン…

2024-01-08

【C#】usbipd-winを使ってWSL2にカメラを接続する方法を簡略化する（usbipd-win v4.0.0）

C#

はじめに完成図注意点 C#コードはじめにusbipd-winを使ってWSL2にカメラを接続する方法は以下の手順です。管理者権限でコマンドプロンプトを立ち上げる「usbipd list」コマンドでカメラのBUSIDを調べる「usbipd bind -b (busid)」「usbipd attach -b (…

2024-01-07

【更新記事】WSL2でWebカメラを使う（usbipd-win v4.0.0）

Ubuntu on WSL2 Ubuntu 22.04 LTS on WSL2

はじめに過去にもWebカメラを使用する方法を書いています。2年ぶりに更新記事を書きました。 touch-sp.hatenablog.com 環境Windows 11です。使用したカメラはロジクール C922 Pro Stream Webcamです。 PS C:\> wsl -v WSL バージョン: 2.0.9.0 カーネルバー…

2024-01-06

【PyGithub】複数のGitHubリポジトリに対して最終更新日を取得する

はじめにAIによる画像生成、動画生成に関するプログラムは日々新しいものが公開されています。それらをフォローするためにGitHubリポジトリを開いて更新をチェックすることがたまにあります。複数のリポジトリをいちいち開くのは面倒くさいので最終更新日を…

#PyGitHub

2024-01-05

【IP-Adapter】IP-Adapter-FaceID-PlusV2 が公開されていたのでさっそく使ってみました。

画像生成

はじめにIP-Adapterの進化が止まりません。「FaceID」→「FaceID-Plus」→「FaceID-PlusV2」とどんどん進化しています。今回は今現在最新の「FaceID-PlusV2」を使ってみます。目的顔写真1枚からその人物の複数の画像を作成することです。PC環境 Windows 11 CUD…

#IP-Adapter

2024-01-04

【Ubuntu】Pythonを使ってシンボリックリンクの作成を簡略化する

Ubuntu22.04入門

はじめにWindowsでシンボリックリンクの作成を簡略化するC#のコードを以前書きました。 touch-sp.hatenablog.com 自分で言うのも何ですが便利に使っています。 Linuxでも同じようなことができないかと考えPythonスクリプトを書きました。Pythonスクリプト im…

2024-01-04

【Diffusers】Stable Diffusion XL Long Weighted Prompt Pipelineで clip skip と FreeU が使えるようになったとのことなのでさっそく使ってみました。

画像生成

はじめに「Long Weighted Prompt Pipeline」はプロンプトの重み付けをする時にA1111のスタイルが使え、かつ長いプロンプトが使用できるようになるパイプラインです。Diffusersではそういった用途にcompelというライブラリを使用するのですが、はっきり言って…

#FreeU #SDXL

パソコン関連もろもろ

2024-01-01から1ヶ月間の記事一覧

【Image2Video】【Diffusers】PIA（Personalized Image Animator）+ FreeInit で動画を作成

【Diffusers】multiple IP-Adapters で遊んでみた

PhotoMaker と modernDisneyXL で遊んでみた

【Face LoRA（顔LoRA）】LoRAにPivotal Tuningを組み合わせて特定の顔を学習させてみました。

IP-Adapter-FaceID-PlusV2 で同一人物の写真が何枚も作れるのでLoRA学習用データをつくってみました。

【Video2Video】Diffusers で AnimateDiffVideoToVideoPipeline というのが公開されていたので AnimateDiff v2 と v3 で実行してみました。

【InstantID】IP-Adapter と ControlNet を使った顔写真のスタイル変換

IP‐Adapter‐Faceについての記事をまとめました。

【PySide6】ドラッグ&ドロップでファイルやフォルダのアドレスを入力できる QLineEdit （または QTextEdit）を作成しました

【Ubuntu】PySide6を使う

Ubuntu 24.04で日本語入力を可能にする方法

【IP-Adapter】SDXL用の IP-Adapter-FaceID-PlusV2 が公開されたので以前のモデルと比較してみました。

【Diffusers】AnimateDiff + FreeInit が Diffusers から使えるようになりました。

【PhotoMaker】人物写真をカスタマイズできる PhotoMaker を使ってみました。

Pythonを使って写真に写る顔を切り取る方法（【face-alignment】と【dlib】）

【Diffusers】Diffusers から IP-Adapter FaceID が使えるようになりました。

【Diffusers】【Inpaint】StableDiffusionInpaintPipeline と MaskedStableDiffusionImg2ImgPipeline の違いを比較してみました。

【Moore-AnimateAnyone】1枚の画像とポーズ動画から動画を作成する

【IP-Adapter】IP-Adapter と Inpaintモデルを組み合わせれば写真に写る人物の顔を好みの顔に変えられる？

【IP-Adapter】SDXL用の IP-Adapter-FaceID が公開されていたのでさっそく使ってみました。

Diffusersでは「DPM++2M SDE Karras」がうまく機能していなかったらしい

【Video2Video】「Rerender A Video」がDiffusersから使えるようになっていたのでさっそく使ってみました。

【Image2Video】PIA（Personalized Image Animator）を使って動画を作成してみました

開発中のUbuntu 24.04を使用してみた（2024年1月）

【C#】usbipd-winを使ってWSL2にカメラを接続する方法を簡略化する（usbipd-win v4.0.0）

【更新記事】WSL2でWebカメラを使う（usbipd-win v4.0.0）

【PyGithub】複数のGitHubリポジトリに対して最終更新日を取得する

【IP-Adapter】IP-Adapter-FaceID-PlusV2 が公開されていたのでさっそく使ってみました。

【Ubuntu】Pythonを使ってシンボリックリンクの作成を簡略化する

【Diffusers】Stable Diffusion XL Long Weighted Prompt Pipelineで clip skip と FreeU が使えるようになったとのことなのでさっそく使ってみました。