【DiffEdit】【Diffusers】写真に写る犬を猫に変換する

画像生成

はじめにあらたにDiffEdit（Zero-shot Diffusion-based Semantic Image Editing with Mask Guidance）というのがDiffusersから使えるようになっていたので試してみます。やったことはタイトル通り「写真に写る犬を猫に変換する」です。似たようなものは過去…

#Diffusers

2023-04-26

【ToDo】PySide6==6.5.0 と PyAutoGUI==0.9.53 の組み合わせでエラーが出ました。

PySide6

エラー内容 qt.qpa.window: SetProcessDpiAwarenessContext(DPI_AWARENESS_CONTEXT_PER_MONITOR_AWARE_V2) failed: COM error 0x5: アクセスが拒否されました。 Qt's default DPI awareness context is DPI_AWARENESS_CONTEXT_PER_MONITOR_AWARE_V2. If you …

2023-04-25

【Text2Video-Zero】【Diffusers】Text2Video-ZeroのVRAM使用量を減らしたい

動画生成

最終更新日：2023年6月14日 DiffusionのText2Video-ZeroがTorch2.0用にアップデートされました。 VRAM使用量が改善したようなので記事を更新しました。 github.com 前回記事touch-sp.hatenablog.com 結果640x640の動画で試しました。chunk=2で固定しています…

2023-04-19

【AnimatedDrawings】【閲覧注意】Michael JacksonのThrillerを躍らせてみました。ファンのみなさまごめんなさい。

動画生成

結果環境 Ubuntu 20.04 on WSL2 (Windows 11) CUDA 11.6.2 Python 3.8方法VideoTo3dPoseAndBvhYouTube動画からモーションファイル（拡張子:bvh）を作成しました。こちらを使わせて頂きました。 github.com まずはリポジトリをクローンして学習済みパラメー…

#Animated Drawings

2023-04-18

【AnimatedDrawings】個人的ToDoリスト

github.com

2023-04-16

【AnimatedDrawings】いらすとやの女性を踊らせてみた

動画生成

結果元画像こちらの画像を使わせて頂きました。 www.irasutoya.com 前回の記事前回の記事の続きです。画像をいらすとやの女性に変更しただけです。詳しくは前回の記事を見て下さい。 touch-sp.hatenablog.com mask画像と関節の位置を記述したyamlファイルを…

#Animated Drawings

2023-04-15

【AnimatedDrawings】1枚の手書きイラストを動かす（WSL2での動作確認）

動画生成

github.com 結果環境構築 Ubuntu 20.04 on WSL2 (Windows 11) Python 3.9CUDAは必要ありません。以下をインストールする必要があります。 sudo apt install libosmesa6-dev freeglut3-dev sudo apt install libglfw3-dev libgles2-mesa-dev sudo apt insta…

#Animated Drawings

2023-04-14

【ESPnet】【Python3.10】テキストファイルから音声ファイルを作成する

音声合成

以前にESPnetに関しての記事を書きました。 touch-sp.hatenablog.com その時にはPython3.10で動作させることができませんでした。最近の改良でPython3.10でも動作するようになったようです。以下の環境で問題なく動作しました。torch==1.13.1+cu117 Ubuntu…

2023-04-14

【SadTalker】1枚の顔写真と音声データだけでしゃべっている動画を作成

動画生成

github.com 結果元画像はこちらを使いました。「haduki_mix v1.0」で作成したものです。顔写真1枚しか使っていません。音声は「ESPnet」で作成したものです。こちらを参照して下さい。結果はGoogle Bloggerに載せています。 support-touchsp.blogspot.com…

#SadTalker

2023-04-13

【VideoCrafter】また新しい動画作成モデルが公開されていました。さっそく使ってみました。

動画生成 ControlNet

最終更新日：2023年4月21日 PyTorch 2.0 + xFormerの組み合わせで以前よりVRAM使用量がかなり削減されています。 github.com結果元動画作成動画prompt:「An ostrich walking in the desert, photorealistic, 4k」 PROMPT="An ostrich walking in the desert…

2023-04-12

【Text2Video-Zero】【Diffusers】Diffusers から Text2Video-Zero が使えるようになったのでさっそく使ってみました

動画生成 ControlNet

最終更新日：2023年6月13日 DiffusionのText2Video-ZeroがTorch2.0用にアップデートされました。 VRAM使用量が改善したようなので記事を更新しました。 github.com 結果左のポーズ動画から右の動画を作成しました。ポーズ動画はこちらからダウンロードさせ…

2023-04-07

【Text2Video-Zero】【動画生成AI】作った動画に背景をつけてみました

動画生成

前回の続きです。 touch-sp.hatenablog.com 今回は流れるような背景をつけてみました。少し流れ方が速すぎるような気もしますが（笑）。もっと良い画像が出来たら適宜更新します。方法Step 1：動画を作成する前回通りです。 touch-sp.hatenablog.com Step 2…

2023-04-04

【Text2Video-Zero】【ControlNet】いろいろ設定をいじってみる。結果はどのように変わるか？

ControlNet 動画生成

はじめにRTX 3080 (VRAM12GB)を使って力任せに動画作成をしてみました。前回使用したText2Video-ZeroにControlNetを組み合わせています。 touch-sp.hatenablog.com あらたにスクリプトを書きました。こちらです→「canny_video2video.py」結果Anything-v5.0 …

2023-04-01

【Text2Video-Zero】また新しい動画作成モデルが公開されていました。特徴は？

動画生成 ControlNet

github.com 特徴今わかっている特徴は簡単に使えるいろんなモデルが使える ControlNetが使える注意点VRAM使用は11～12GBでした。VRAM 12GBのRTX 3080で動作確認しています。さっそく使ってみるsimple Text-To-Video非常に簡潔なスクリプトで実行可能です…

パソコン関連もろもろ

2023-04-01から1ヶ月間の記事一覧

【DiffEdit】【Diffusers】写真に写る犬を猫に変換する

【ToDo】PySide6==6.5.0 と PyAutoGUI==0.9.53 の組み合わせでエラーが出ました。

【Text2Video-Zero】【Diffusers】Text2Video-ZeroのVRAM使用量を減らしたい

【AnimatedDrawings】【閲覧注意】Michael JacksonのThrillerを躍らせてみました。ファンのみなさまごめんなさい。

【AnimatedDrawings】個人的ToDoリスト

【AnimatedDrawings】いらすとやの女性を踊らせてみた

【AnimatedDrawings】1枚の手書きイラストを動かす（WSL2での動作確認）

【ESPnet】【Python3.10】テキストファイルから音声ファイルを作成する

【SadTalker】1枚の顔写真と音声データだけでしゃべっている動画を作成

【VideoCrafter】また新しい動画作成モデルが公開されていました。さっそく使ってみました。

【Text2Video-Zero】【Diffusers】Diffusers から Text2Video-Zero が使えるようになったのでさっそく使ってみました

【Text2Video-Zero】【動画生成AI】作った動画に背景をつけてみました

【Text2Video-Zero】【ControlNet】いろいろ設定をいじってみる。結果はどのように変わるか？

【Text2Video-Zero】また新しい動画作成モデルが公開されていました。特徴は？