【Diffusers】Z Image Turboを使ってみる(Chroma と比べてみました)

結果

Chromaと比較してみました。

Z Image Turboの結果

Chromaの結果

こちらの記事を見て下さい。

Pythonスクリプト

import torch
from diffusers import ZImagePipeline

pipe = ZImagePipeline.from_pretrained(
    "Tongyi-MAI/Z-Image-Turbo",
    torch_dtype=torch.bfloat16
).to("cuda")

prompt = "着古した黒いレザージャケット、ダークなサングラス、破れたジーンズを身につけた、タフでストリートライクな態度の擬人化されたカピバラの超リアルで高品質な写真。カピバラは、鮮やかな落書きで覆われた都会の壁にさりげなく寄りかかっている。その背後には、垂れるような黄色のスプレーペイントで、ストリートアート風の大きな文字で「HuggingFace」と書かれている。シーンは薄暗い路地にあり、ムーディーな照明、散乱するゴミ、エッジの効いた反抗的な雰囲気--まるでアンダーグラウンド・コミックから飛び出してきたようなキャラクターだ。"

image = pipe(
    prompt,
    height=1024,
    width=1024,
    num_inference_steps=9,
    guidance_scale=0.0,
    generator=torch.manual_seed(42),
).images[0]

image.save("zimage.png")

環境構築

pyproject.tomlを載せておきます。

uvを使うとuv syncだけで環境構築できると思います。

[project]
name = "zimage"
version = "0.1.0"
description = "Add your description here"
readme = "README.md"
requires-python = ">=3.13"
dependencies = [
    "accelerate==1.12.0",
    "diffusers==0.36.0",
    "hf-xet==1.2.0",
    "torch==2.9.1+cu126",
    "transformers==4.57.3",
]

[[tool.uv.index]]
name = "torch-cuda"
url = "https://download.pytorch.org/whl/cu126"
explicit = true

[tool.uv.sources]
torch = [{ index = "torch-cuda" }]