はじめに
「LongerCrafter」は「FreeNoise」という方法を用いた動画生成モデルです。高品質の長い動画を生成することができるのが特徴とされています。さっそく試してみました。環境構築
Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10
1行で環境構築できるように「requirements.txt」を作成しました。
pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/LongerCrafter/requirements.txt
準備
GitHubのリポジトリをクローンして、モデルを事前にダウンロードする必要があります。実行
python scripts/evaluation/inference_freenoise.py \ --seed 123 \ --mode base \ --ckpt_path checkpoints/base_1024_v1/model.ckpt \ --config configs/inference_t2v_1024_v1.0_freenoise.yaml \ --savedir results \ --n_samples 1 \ --bs 1 --height 576 --width 1024 \ --unconditional_guidance_scale 12.0 \ --ddim_steps 50 \ --ddim_eta 0.0 \ --prompt_file prompts/prompt.txt \ --savefps 8 \ --frames 24 \ --window_size 16 \ --window_stride 4
結果
Frames = 16
16フレームの動画を作成するのに約3分かかりました。Saved in results. Time used: 177.04 seconds
Frames = 24
Saved in results. Time used: 285.62 seconds
結果はGoogle Bloggerに載せています。
support-touchsp.blogspot.com