【MasaCtrl】 MasaCtrl with T2I-Adapter を使って動画を作成してみる

顔は崩れてしまいましたがフレーム間の一貫性が保たれています。

着ている服や靴、背景に注目して下さい。

はじめに

MasaCtrlに関しては以下を参照して下さい。
touch-sp.hatenablog.com
ざっくり言うと一貫性のある画像（例えば同じキャラクターの姿勢違いなど）を生成することが可能です。

今回はMasaCtrlを利用して動画作成してみました。

参照動画

ポーズ動画はこちらからダウンロードさせて頂きました。

冒頭の結果の左側動画です。

感想

以前Text2Video-Zeroというモデルを使って動画作成したことがあります。
touch-sp.hatenablog.com
今回顔は崩れてしまっていますがMasaCtrlの方がフレーム間の一貫性が保たれている印象です。

実行方法

python masactrl_w_adapter.py ^
--which_cond openpose ^
--cond_path_src 0.png ^
--cond_path pose ^
--cond_inp_type openpose ^
--prompt_src "1boy, casual, outdoors, dancing" ^
--prompt "1boy, casual, outdoors, dancing" ^
--sd_ckpt models/sd-v1-4.ckpt ^
--resize_short_edge 512 ^
--cond_tau 1.0 ^
--cond_weight 1.0 ^
--n_samples 1 ^
--adapter_ckpt models/t2iadapter_openpose_sd14v1.pth

参照動画をいったん画像にばらしました。

全16フレームありました。

0.png以外の15画像を「pose」というフォルダに集めています。

最後作成された画像をあつめて動画にしました。