728x90

Z-Image-Turbo + ComfyUI 가이드

📌 왜 Z-Image-Turbo + ComfyUI 인가?

Z-Image-Turbo는 6B 파라미터만 사용하지만, 고성능 모델에 준하는 사실적이고 고품질 이미지 생성이 가능한 최신 텍스트→이미지 생성 모델입니다. 단 8단계(step)만으로 이미지 생성이 가능해, 리소스가 제한된 PC에서도 쓸 수 있어요.
특히 인물 초상화, 제품 이미지, 광고/포스터, UI/레이아웃 이미지처럼 “사실감 + 텍스트 포함 + 빠른 반복 생성”이 필요한 작업에 강점이 있습니다.
ComfyUI의 공식 workflow 템플릿 덕분에, 복잡한 노드 설정 없이 drag & drop만으로 쉽게 사용할 수 있어요.

📥 필요한 파일 & 공식 다운로드 링크

Z-Image ComfyUI Workflow Example - ComfyUI

Z-Image is a 6B parameter efficient image generation foundation model with single-stream diffusion transformer, offering sub-second inference latency.

docs.comfy.org

Z-Image-Turbo 를 사용하려면, 아래 파일들을 다운로드하고 지정 폴더 구조에 저장해야 합니다.

파일 종류 / 용도파일명공식 다운로드 링크

텍스트 인코더 (Text Encoder)	qwen_3_4b.safetensors	https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/text_encoders/qwen_3_4b.safetensors
Diffusion 모델 (핵심 모델)	z_image_turbo_bf16.safetensors	https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/diffusion_models/z_image_turbo_bf16.safetensors
VAE (이미지 디코더)	ae.safetensors	https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/vae/ae.safetensors
추가 (ControlNet 용)	Z-Image-Turbo-Fun-Controlnet-Union.safetensors	https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union/resolve/main/Z-Image-Turbo-Fun-Controlnet-Union.safetensors

📂 권장 폴더 구조 (ComfyUI 폴더 내)

✅ 참고: 공식 문서에서는 “이 3가지 파일 + (옵션)ControlNet 패치”를 ‘필수 구성 요소’로 명시하고 있습니다.

⚙️ ComfyUI 설정 & 워크플로우 로드 방법

ComfyUI를 최신 버전으로 업데이트 — 업데이트 하지 않으면 Z-Image 관련 노드가 보이지 않을 수 있어요.
위의 모델 파일들을 다운로드해서, ComfyUI 내부의 models/ 하위 폴더에 각자 알맞은 위치에 저장하세요.
공식 Z-Image-Turbo Text-to-Image workflow JSON 파일을 다운로드 (예: image_z_image_turbo.json) — ComfyUI 템플릿 또는 공식 GitHub / example 페이지에서 받을 수 있어요.
ComfyUI 실행 후, 해당 JSON 워크플로우 파일을 drag & drop 하면 자동으로 로드됨.
Prompt 입력 → 설정 확인 → “Generate / Queue Prompt” 클릭 → 이미지 생성 완료!

이 과정으로 복잡한 노드 연결 없이도 바로 사용 가능합니다.

✨ 예시 프롬프트 & 프롬프트 작성 팁

좋은 결과물을 얻기 위해선, 프롬프트에 충분한 디테일을 넣는 것이 중요합니다. 아래는 추천되는 구조와 예시입니다.

아래 생성 이미지는 맥미니 M2 pro 모델에 설치해서 생성한 이미지입니다.(1024*1024 이미지 1장 생성하는 데 약 4분이 걸리네요. ㅜㅜ. 'Z-Image' 사용을 위해 그래픽 카드 좋은 것으로 하나 장만해야 할 것 같습니다.)

생성된 이미지는 나노바나나 프로 못지 않은 퀄리티입니다. 상업적 이용이 가능하고 무엇보다 워터마크 없이 생성할 수 있어 너무 좋습니다.

다만 아직 이미지 생성에서 한글 텍스트 표현은 제대로 하지 못하는 단점이 있습니다. 이것도 빨리 해결되었으면 합니다.

🔹 프롬프트 기본 구조 템플릿

[주제/대상] + [행동/포즈] + [배경/환경] + [조명 & 분위기] + [의상/스타일/소품] + [렌더링 스타일/무드] + [품질/기술 키워드]

🔹 영어 예시

A 28-year-old woman with auburn wavy hair sitting by a rain-streaked window in a cozy coffee shop, reading a worn paperback novel, one hand holding a coffee mug. Soft warm morning light streaming through the glass, casting gentle shadows. Cream cable-knit sweater, thoughtful expression with slight smile. Medium shot, shallow depth of field, background softly blurred, intimate lifestyle photography, photorealistic, 8K, high detail, natural skin texture.

Epic fantasy scene: massive dragon soaring through the sky, wings spread wide, mid-air, head and snarling jaws dominating the frame, fire blasting from its mouth, glowing embers trailing, scales shimmering in sunlight, cracked and scorched textures highly detailed, motion blur on wings, dynamic flight, dramatic lighting, clouds and smoke swirling, distant medieval city rooftops below, cinematic perspective, photorealistic, 4K, high detail.

🔹 한국어 + 영어 혼합 예시 (한국 사용자용)

30대 한국 여성, 긴 검은 생머리, 도시 야경 옥상에서 바람에 머리카락 날리는 포즈, 네온 라이트와 도시 불빛 배경, 가을 밤의 쓸쓸하고 몽환적인 분위기, 블랙 가죽 재킷과 진, cinematic lighting, shallow depth of field, photorealistic, 4K, high detail.

고대 중세 풍 마법사, 손에 빛나는 마법구슬 들고 있는 정면 상반신 초상, 어두운 돌 성벽 배경, 양초 빛 아래 따뜻한 조명, 중세 로브와 가죽 벨트 착용, dramatic lighting, dark fantasy style, photorealistic, high detail, 8K.

🎯 팁: 가능한 한 많은 디테일을 넣을수록 결과물이 프롬프트에 충실해져요 — 나이, 인물의 특징, 배경, 조명, 카메라 각도, 분위기, 질감, 스타일 등.

💡 활용 팁 & 권장 설정

샘플링 단계 (Steps): 일반적으로 8–9 스텝이 권장됩니다. Turbo는 증류된 모델이라, 과도한 스텝은 오히려 품질 저하를 부를 수 있어요.
가이던스 / CFG 스케일: 기본값으로 guidance_scale = 0 또는 낮은 값 — negative prompt 없이도 좋은 품질을 내는 경우가 많아요.
해상도 & VRAM 고려: 1024×1024px 권장. VRAM이 부족한 경우 768×768 또는 낮은 해상도를 사용하거나 Quantized / FP8 버전을 활용하세요.
ControlNet 활용: 추가로 다운로드한 Z-Image-Turbo-Fun-Controlnet-Union.safetensors 파일을 통해, 엣지, 포즈, 뎁스 맵 기반 가이드 생성이 가능해요.

🧠 이런 경우에 특히 추천돼요

인물 포트레이트 / 제품 사진 / 광고 비주얼 / 포스터 / UI 디자인처럼 텍스트 + 그래픽 + 실사감이 모두 중요한 작업
VRAM이 많지 않은 일반 GPU 사용자 (예: 8–16 GB VRAM 이하)
빠르게 여러 버전을 실험해 보고 싶은 경우 — 프롬프트 수정 → 재생성 → 비교 반복이 쉽고 빠릅니다.
영어 / 중국어 / 혼합 텍스트 포함 이미지가 필요한 경우 — Z-Image-Turbo는 다국어 텍스트 렌더링에 강합니다.

728x90

'AI 관련 정보' 카테고리의 다른 글

구글 AI 검색 모드, 웹사이트 유입의 종말인가? 기회인가? (0)	2025.12.09
구글 제미나이 3(Gemini 3), AI 패권 전쟁의 판을 뒤집다 (0)	2025.12.08
개발 생산성을 높이는 비밀: 'Vibe Coding'과 'Vibe Planning'의 미학 (0)	2025.11.27
인공지능 시대의 두뇌 대결: 구글 TPU vs 엔비디아 GPU, 완벽 비교 분석 (0)	2025.11.27
판도가 뒤집혔다? 구글 제미나이 3.0이 쏘아 올린 '탈(脫) 엔비디아' 신호탄! (0)	2025.11.25

MuMu Digest

Z-Image-Turbo + ComfyUI 가이드

Z-Image-Turbo + ComfyUI 가이드

📌 왜 Z-Image-Turbo + ComfyUI 인가?