2023-04-01から1ヶ月間の記事一覧

【DiffEdit】【Diffusers】写真に写る犬を猫に変換する

はじめにあらたにDiffEdit(Zero-shot Diffusion-based Semantic Image Editing with Mask Guidance)というのがDiffusersから使えるようになっていたので試してみます。やったことはタイトル通り「写真に写る犬を猫に変換する」です。似たようなものは過去…

【ToDo】PySide6==6.5.0 と PyAutoGUI==0.9.53 の組み合わせでエラーが出ました。

エラー内容 qt.qpa.window: SetProcessDpiAwarenessContext(DPI_AWARENESS_CONTEXT_PER_MONITOR_AWARE_V2) failed: COM error 0x5: アクセスが拒否されました。 Qt's default DPI awareness context is DPI_AWARENESS_CONTEXT_PER_MONITOR_AWARE_V2. If you …

【Text2Video-Zero】【Diffusers】Text2Video-ZeroのVRAM使用量を減らしたい

最終更新日:2023年6月14日 DiffusionのText2Video-ZeroがTorch2.0用にアップデートされました。 VRAM使用量が改善したようなので記事を更新しました。 github.com 前回記事touch-sp.hatenablog.com 結果640x640の動画で試しました。chunk=2で固定しています…

【AnimatedDrawings】【閲覧注意】Michael JacksonのThrillerを躍らせてみました。ファンのみなさまごめんなさい。

結果 環境 Ubuntu 20.04 on WSL2 (Windows 11) CUDA 11.6.2 Python 3.8方法VideoTo3dPoseAndBvhYouTube動画からモーションファイル(拡張子:bvh)を作成しました。こちらを使わせて頂きました。 github.com まずはリポジトリをクローンして学習済みパラメー…

【AnimatedDrawings】個人的ToDoリスト

github.com

【AnimatedDrawings】いらすとやの女性を踊らせてみた

結果 元画像こちらの画像を使わせて頂きました。 www.irasutoya.com 前回の記事前回の記事の続きです。画像をいらすとやの女性に変更しただけです。詳しくは前回の記事を見て下さい。 touch-sp.hatenablog.com mask画像と関節の位置を記述したyamlファイルを…

【AnimatedDrawings】1枚の手書きイラストを動かす(WSL2での動作確認)

github.com 結果 環境構築 Ubuntu 20.04 on WSL2 (Windows 11) Python 3.9CUDAは必要ありません。 以下をインストールする必要があります。 sudo apt install libosmesa6-dev freeglut3-dev sudo apt install libglfw3-dev libgles2-mesa-dev sudo apt insta…

【ESPnet】【Python3.10】テキストファイルから音声ファイルを作成する

以前にESPnetに関しての記事を書きました。 touch-sp.hatenablog.com その時にはPython3.10で動作させることができませんでした。 最近の改良でPython3.10でも動作するようになったようです。 以下の環境で問題なく動作しました。torch==1.13.1+cu117 Ubuntu…

【SadTalker】1枚の顔写真と音声データだけでしゃべっている動画を作成

github.com 結果元画像はこちらを使いました。「haduki_mix v1.0」で作成したものです。 顔写真1枚しか使っていません。 音声は「ESPnet」で作成したものです。こちらを参照して下さい。 結果はGoogle Bloggerに載せています。 support-touchsp.blogspot.com…

【VideoCrafter】また新しい動画作成モデルが公開されていました。さっそく使ってみました。

最終更新日:2023年4月21日 PyTorch 2.0 + xFormerの組み合わせで以前よりVRAM使用量がかなり削減されています。 github.com結果元動画 作成動画prompt:「An ostrich walking in the desert, photorealistic, 4k」 PROMPT="An ostrich walking in the desert…

【Text2Video-Zero】【Diffusers】Diffusers から Text2Video-Zero が使えるようになったのでさっそく使ってみました

最終更新日:2023年6月13日 DiffusionのText2Video-ZeroがTorch2.0用にアップデートされました。 VRAM使用量が改善したようなので記事を更新しました。 github.com 結果 左のポーズ動画から右の動画を作成しました。 ポーズ動画はこちらからダウンロードさせ…

【Text2Video-Zero】【動画生成AI】作った動画に背景をつけてみました

前回の続きです。 touch-sp.hatenablog.com 今回は流れるような背景をつけてみました。少し流れ方が速すぎるような気もしますが(笑)。 もっと良い画像が出来たら適宜更新します。方法Step 1:動画を作成する前回通りです。 touch-sp.hatenablog.com Step 2…

【Text2Video-Zero】【ControlNet】いろいろ設定をいじってみる。結果はどのように変わるか?

はじめにRTX 3080 (VRAM12GB)を使って力任せに動画作成をしてみました。前回使用したText2Video-ZeroにControlNetを組み合わせています。 touch-sp.hatenablog.com あらたにスクリプトを書きました。 こちらです→「canny_video2video.py」結果Anything-v5.0 …

【Text2Video-Zero】また新しい動画作成モデルが公開されていました。特徴は?

github.com 特徴今わかっている特徴は 簡単に使える いろんなモデルが使える ControlNetが使える 注意点VRAM使用は11~12GBでした。VRAM 12GBのRTX 3080で動作確認しています。さっそく使ってみるsimple Text-To-Video非常に簡潔なスクリプトで実行可能です…