FLUX.2-Klein 모델 은 Black Forest Labs 사에서 만든 오픈소스 이미지 편집 모델이다. Flux1 에서도 이미지 편집 모델이 있었다. Flux-Kontext 모델이 였는데, 이번에 Flux2 에서도 Flux2-Klein 모델이 출시되었다. 이번 포스팅에서는 이 모델을 사용해보고 특징을 알아보고자 한다. 참고로 Qwen-Image 편집모델은 아래 포스팅을 참조하기를 바란다. ( 막강한 이미지 편집 모델 - QWEN-Image-Edit-2511 ) Flux2-klein 모델로 텍스트를 편집한 이미지 1. Flux2-Klein 의 특징 뛰어난 품질로 1초 미만의 이미지 생성을 위한 간소화된 모델. flux-2-klein-9b-fp8 : 9.4G flux-2-klein-base-4b-fp8 : 4.0G flux-2-klein-distilled-4b-fp8 : 3.8G base-4b 모델을 사용결과 대략 30steps 에 55초 정도 소요 (그래픽카드 4070ti, 16G 일때) 이다. distilled-4b 모델은 10초 소요, 1초라는 것은 5090 이상에서 distilled 버전을 사용 (4 steps) 했을 경우이다. 이 모델은 Qwen 보다는 크기가 작다. 텍스트-이미지 및 이미지-이미지 다중 참조 편집을 하나의 통합 모델로 제공합니다. 프롬프트의 가독성이 뛰어나다. 영어 뿐만 아니라 한글 프롬프트도 인식하여 생성한다. Text 는 정확하게 잘 써진다. 다만 영어 만...... 2. Flux2-klein-base-4b 사용방법 여기서는 Comfyui 를 이용하여 사용하는 방법이다. 모델 다운로드 설치 : Comfyui 홈페이지에 ( https://docs.comfy.org/tutorials/flux/flux-2-klein ) 에 가면 Flux2-klein-base-4b 뿐 만 ...
Qwen-Image-2512 와 Z-Image-Turbo 모델은 모두 알리바바(Alibaba)에서 개발한 오픈소스 이미지 생성 모델 이다. AI 분야에 있어서 중국의 기술력은 미국 다음으로, 우리나라와 비교해서 많이 앞서가고 있다. 어떤 부분의 AI 에 있어서는 미국을 능가하는 기술력을 갖추고 있다고 생각한다. 중국이라는 나라를 무조건 찬양하는 것도 안되지만 깔보고 혐오하는 것도 바람직하지 않다. 적어도 내가 판단하기에 AI 분야에 있어서는 중국으로 부터도 많은 것을 배워야 한다고 생각한다. 알리바바에서 출시된 두가지 모델을 로컬에서 사용해 본 결과 둘 다 모두 뛰어난 이미지 생성용 AI 모델이다. stable diffusion 이나 Flux 보다 더 좋다고 느낀다. Qwen-Image-2512-gguf 1. Qwen-Image-2512 와 Z-Image-Turbo 비교 구분 Qwen-Image-2512 Z-Image-Turbo 모델 규모 약 20B (MMDiT 구조) 약 6B (S3-DiT 구조) 주요 강점 압도적인 화질, 텍스트 렌더링, 정교한 묘사 초고속 생성(1초 내외), 낮은 사양 요구 추론 단계 보통 20~50 steps (LoRA 사용 시 4 steps) 8~9 steps (기본 터보 모드) VRAM 요구량 높음 (FP8/GGUF 기준 20~30GB 권장) 매우 낮음 (4GB VRAM에서도 실행 가능) 이미지 느낌 시네마틱, 부드러운 색감, 풍부한 깊이감 실사(Photorealistic), 높은 대비, 선명함 내 컴퓨터 GPU 4070ti . 16G 에서 생성 속도는 대략 Qwen-Image-2512-gguf : 60 초 Z-Image-Turbo : 10초 2. 두 모델을 이용한 이미지 생성 Z-Image-Turbo : Z-Image-Turbo - 초고속 텍스트 to 이미지 생성 모델 참조 Qwen-Image-2512-gguf : 먼저 ...