前回(waifu diffusion)の結果
記事はこちらです。
今回の結果(dreamlike-photoreal-2.0)
dreamlike-artが公開してくれているdreamlike-photoreal-2.0のimg2imgをdiffusersから実行してみました。
huggingface.co
指の描写を含めて非常にきれいにできました。すごいの一言です。
元画像
画像はいらすとやから使わせて頂きました。
こちらの画像です。
RGBA→RGB(背景を透明から白色に)の変換をしたうえで使用しています。
変換スクリプトは記事の最後にのせておきます。
prompt
blonde woman desk notebook writing tumblr digital art handsome girl diffused natural skin glow
negative prompt
worst quality low quality medium quality duplicate deleted lowres bad anatomy bad hands text error missing fingers extra digit fewer digits cropped jpeg artifacts signature watermark blurry
パラメーター
scheduler: (default) seed: 20019 guidance_scale: 10.5 strength: 0.9 steps: 50
関連記事
使用したPCはこちらtouch-sp.hatenablog.com
Python環境構築についてはこちら
touch-sp.hatenablog.com
描画する人物の姿勢を望み通りにしたいならtxt2imgよりimg2imgの方が望ましいという話はこちら
touch-sp.hatenablog.com
RGBA2RGB
from PIL import Image import argparse import os parser = argparse.ArgumentParser() parser.add_argument( '--image', type=str, help='path to RGBA image' ) parser.add_argument( '--ext', type=str, default='jpg', help='extension' ) opt = parser.parse_args() img_path = opt.image img_fname = os.path.splitext(os.path.basename(img_path))[0] img = Image.open(img_path) new = Image.new('RGB', img.size, (255, 255, 255)) new.paste(img, mask=img.split()[3]) new.save(f'rgb_{img_fname}.{opt.ext}')