【LongerCrafter (FreeNoise)】LongerCrafter という動画作成モデルを試してみました

github.com

はじめに

「LongerCrafter」は「FreeNoise」という方法を用いた動画生成モデルです。

高品質の長い動画を生成することができるのが特徴とされています。

さっそく試してみました。

環境構築

Ubuntu 22.04 on WSL2
CUDA 11.8
Python 3.10



1行で環境構築できるように「requirements.txt」を作成しました。

pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/LongerCrafter/requirements.txt

準備

GitHubのリポジトリをクローンして、モデルを事前にダウンロードする必要があります。

実行

python scripts/evaluation/inference_freenoise.py \
  --seed 123 \
  --mode base \
  --ckpt_path checkpoints/base_1024_v1/model.ckpt \
  --config configs/inference_t2v_1024_v1.0_freenoise.yaml \
  --savedir results \
  --n_samples 1 \
  --bs 1 --height 576 --width 1024 \
  --unconditional_guidance_scale 12.0 \
  --ddim_steps 50 \
  --ddim_eta 0.0 \
  --prompt_file prompts/prompt.txt \
  --savefps 8 \
  --frames 24 \
  --window_size 16 \
  --window_stride 4 

結果

Frames = 16

16フレームの動画を作成するのに約3分かかりました。

Saved in results. Time used: 177.04 seconds

Frames = 24

Saved in results. Time used: 285.62 seconds



結果はGoogle Bloggerに載せています。
support-touchsp.blogspot.com




このエントリーをはてなブックマークに追加