기본 콘텐츠로 건너뛰기

Featured Post

이미지에서 프롬프트 추출하기 in Comfyui - QWEN3-VL

 이미지 또는 사진에서 Prompt(프롬프트)를 추출하여 사용하기 네이버, 구글 또는 핀터레스트 등의 사이트에서 마음에 드는 사진을 보고 비슷한 이미지를 만들고 싶을때,   그 사진을 보고 직접 그것을 프롬프트로 만들기가 어려운 일이다.  만들었다고 해도 그것을 이용하여 이미지를 생성해 보면 원하는 이미지와는 동 떨어진 이미지가 만들어지기 쉽다. 그래서 보통은 chatGPT 나 GEMINI 를 이용하여 이미지를 업로드하고 프롬프트를 만들어 달라고 하여 추출한다.  나도 이런 방식으로 종종 프롬프트를 추출하여 사용하곤 한다. 여기에서는 외부 도움을 받아 추출하는 대신  내 컴퓨터에서 추출하여 사용하는 방법이다. 1. 이미지에서 프롬프트 추출 예 Z-Image-Turbo 로 만든 이미지 위의 이미지에서 프롬프트를 추출 한다면...... chatGPT : A soft, elegant portrait of a young woman sitting on the floor, painting flowers with a brush and a palette. She wears a crisp white shirt with rolled-up sleeves and fitted blue jeans. Her long dark hair flows naturally as she focuses calmly on her artwork. A vase filled with colorful roses stands beside her. The scene has a warm beige background, smooth lighting, clean details, and a serene, gentle atmosphere. Ultra-high-definition, photorealistic illustration, soft shadows, pastel tones, refined skin texture, delicate rendering. G...
최근 글

Flux2 에 대한 소개 - Flux2-dev

Flux2 가 출시 되었다.  Flux는 독일의 AI 연구소인 Black Forest Labs 에서 개발한 최신 인공지능 이미지 생성 모델인데 Flux2 는 편집도 가능한 모델이 다.  Stable Diffusion SDXL 버전을 사용하는 중에 출시된 Flux 모델을 사용해 보고 Flux 의 이미지 품질에 푹 빠졌었는데 이번에 Flux2 가 출시된 것이다.  요즈음  QWEN-Image-Edit-2509 모델과 나노 바나나 프로 3 등등  이미지 편집에 획기적인 변화가 몰려오고 있는 와중에 Flux2 또한 여기에 함께 한 듯하다. Flux2-dev-gguf 모델로 만든 인포그래픽 이미지 1. Flux2 의 특장점 및 단점 고품질 및 고해상도 출력 (최대 4MP ) 이 가능하다.  사실적인 디테일과 현실과 같은 이미지를 만들어 준다.  복잡한 텍스트를 처리하여 상당히 정확하게 잘 표현해 준다.  디자인 분야에 나노바나나 프로 처럼 매우 유용하게 사용될 수 있다. 다중참조 이미지(10 정도 까지)를 입력하여 원하는 이미지로 블렌딩 할 수있다. 다중언어 지원이 가능하기 때문에 한글로 프롬프트를 입력해도 이미지를 생성 할 수 있다. 다만 오픈 소스 모델로 로컬 컴퓨터에서 사용하기에는 상당한 고성능이 필요하다.   내 컴퓨터 (4070ti 16G) 그래픽 카드에서도 832 x 1536 한장 생성하는데 300초 정도가 소요된다. 오픈 모델 Flux2 [dev] 권장 VRAM 이 24G 이상이다. (지금은 포기가 건강에 좋을듯 하다. ㅜㅜ) 2. Flux2 모델 종류 Flux2 [pro] : 최고급 품질의 폐쇄형 상위 모델. 빠르고 저렴한 이미지 생성 지원하며 API 를 통하여 사용가능하다. Flux2 [dev] : 320억 매개변수를 가진 오픈 웨이트 모델 . 텍스트-이미지 생성 및 다중 입력 이미지 편집 기능이 가능하다.  Flux2 [Flex] : 개발...

Z-Image-Turbo - 초고속 텍스트 to 이미지 생성 모델

 Z-Image-Turbo 은 알리바바에서 출시한  초고속 텍스트 to 이미지 생성 모델이다. 이모델을 이용한 이미지 (1024x1024) 생성 속도는 대략 10초정도이다.  이것은 Stable Diffusion SDXL 버전과 비슷한 생성속도를 보여준다.  Z-Image-Turbo 1. 모델의 종류  Z image turbo : 현재 출시된 모델이며  사실적인 이미지 생성, 영어 및 중국어 이중 언어 텍스트 렌더링, 그리고 강력한 명령어 처리 성능에서 탁월한 성능을 발휘하는 모델이다. Z image base : Diffusion 모델이 아니고,   커뮤니티 중심의 미세 조정 및 맞춤형 개발의 잠재력을 최대한 발휘한다는 모델인데 출시 예정이다. Z image edit : 말 그대로 이미지를 편집 수정할 수 있는 모델로 출시 예정이다. 2. Z image turbo 모델의 특장점 6B  매개변수를 사용하는 강력하고 효율적인 이미지 생성 모델이다.   뛰어난 미적 품질을 유지하면서도 강력한 사실적인 이미지 생성 기능을 제공한다. 복잡한 중국어 및 영어 텍스트를 정확하게 렌더링하는 데 탁월하다.  물론 한국어도 잘 인식한다. 프롬프트 향상 기능은 모델에 추론 기능을 제공하여 표면적 설명을 넘어 근본적인 다양한 지식을 활용한다. 무엇보다도 저 성능의 로컬 컴퓨터에서도 이미지 생성을 빠르게 해준다. 3. 모델의 다운로드 및 설치 Z image turbo : CIVITAI 사이트에서 검색하면 나온다.  turbo 모델을 다운로드하여 사용하면 되는데 컴퓨터 성능이 부족하면 fp8 모델을 다운받아 사용해도 된다. Text Encoder : qwen-3-4b ( https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files/text_encoders ) 에서 다운 받으면된다....

쉽고 빠르게 시작하는 AI 이미지 프롬프트 가이드 - Stable Diffusion, Flux, QWEN

AI 이미지를 생성하는데 필수적이며 중요한 요소 중의 하나가 명령 Prompt(프롬프트)이다. 초보 시절에는 이를 어떻게 작성해야 하는지도 어렵고 헷갈렸으며, 약간 이미지 생성이 숙달되면 많은 프롬프트들을 어떻게 관리하고 활용하는가가 중요한 일이 되었고, 웬만한 이미지들을 만들어본 후에는 다시 또 프롬프트를 효과적으로 어떻게 사용하면 좋은지도 중점 관심 대상이 되었다. 이 포스팅에서는 Prompt 에 대하여 그동안의 숙달 과정과 팁을 정리해 보려고 한다. Prompt 는 이미지 생성에 아주 중요한 요소이다. 시작에 앞서 이미지 생성용 Webui 는 Comfyui 를 사용하여 이미지를 만드시기를 권장한다. Comfyui 는 지금은 설치도 쉽고 Workflow 작성도 Template 들이 있기 때문에 쉽게 할 수 있다. 또한 좀 더 숙달될 경우에는 다양하게 workflow를 변형하여 편하게 사용할 수 있으며 새로운 모델이 출시되면 comfyui에서 대부분 바로 사용이 가능하게 되기 때문에  Comfyui 로 바로 입문하시기를 적극 추천한다. 1. 초보 시절 프롬프트 만들기     초보 시절에는 그냥 막연하다.   영어도 짧고  뭐라고 작성해야 하는지도 어렵고 ...... 그런데 지금은 초보 시절에도 prompt 만드는데에 어려움은 많이 감소 되었다.  그것은 인공지능 AI 도움을 쉽게 받을 수 있기 때문이다. chatGPT 또는 GEMINI 에게 만들어 달라고 요청하면 된다. 굳이 영어가 아닌 한국말로 주제를 설명하고 영어 프롬프트를 만들어 달라고 하면 잘 만들어 준다. 예 : "숲속 통나무집 안에서 포즈를 취하고 있는 여성의 이미지를 만들고 싶어.  적합한 Flux 용 영어 프롬프트를 몇가지 만들어줘"  이렇게 만 해도 아주 잘 만들어준다.  A serene portrait of a woman inside a rustic forest log cabin, warm am...

애니 또는 망가를 실사 이미지로 바꿔주는 Lora - QWEN-Image-Edit-2509

애니 또는 망가를 실사 이미지로 바꿀수 있다면 생각보다 좋은 애니 이미지를 변형하여 다른 이미지 제작에 쓸수가 있다. 이미지 생성하는 Diffusion Model 중에서 가장 인물의 포즈를 잘 표현해서 이미지를 만들어 주는 모델이 Pony 모델인데,  이것은 그림체가 애니 또는 망가 스타일이다.  그런데 이것을 실사 이미지로 변경하면 훨씬 더 현실감 있는 이미지가 된다. 좌: 스케치 망가 이미지 를 우 : 실사 이미지로 변형 1. Lora 다운로드 및 설치 애니를 실사로 바꿔주는 Lora 모델은 몇가지 있는데 그중 쓸만한 모델 하나를 다운로드하여 설치한다. QWEN-Edit_Anime2Real_v4-22 : Civitai 사이트에서 찾아 다운 받을 수 있다. Comfyui 의 Model/Loras 폴더에 설치하고 comfyui 를 재 실행한다. 2. 사용법 QWEN-Image-Edit-2509 사용을 위한 Workflow를 실행한다. QWEN-Image-Edit-2509-gguf Workflow 지난 포스팅에서 사용된 것과 동일한 Workflow 이다. Workflow 에서 QWEN-Edit_Anime2Real_v4-22 Lora 만 불러오면된다. Trigger Word : 将图片转为真实风格 (Convert images to realistic style) 를 TextEncodeQwenImageEditPlus 노드 에 입력한다. 3. 애니 또는 망가를 load 하여 실행결과 좌 : 애니, 우 : 실사 확실하게 변경된 것을 확인 할 수 있다. 좌 : 애니 , 우 : 실사 애니메이션이 확실 할수록 실사 이미지도 잘 만들어진다. 좌 : 애니 , 우 : 실사 이것은 애니가 반실사 느낌이여서 실사로 변경은 되었지만 뚜렷한 변화는 적다. 좌 : 애니, 우 : 실사 Pony 모델은 이런 포즈도 잘 표현되기 때문에 이것을 실사화 하면 좀 더 현실감이 느껴진다. 좌 : 흑백이미지, 우 : 실사 흑백으로 그려진 이미지도 컬러풀한 실사 이미지로 ...

사진 또는 이미지 보정,확대 - Image Upscaler (SeedVR2)

 이미지 또는 사진을 좀 더 고급품질로 확대하고 싶을때 사용할 수있는 좋은 Tool 들이 많이 있다. 그중에서 여기서는 SeedVR2 를 설치하고 사용해 본다.  이 custom nodes 는 주로 video 영상의 Upscale 에 사용되는데 저는 video Upscale 보다는 이미지에 사용하기를 더 선호한다. Image Upscaler - SeedVR2 1. 필요한 노드 Comfyui 에서 Manager 를 클릭 Custom Nodes Manager 클릭 검색창에서 seedVR2 입력하여 검색 SeedVR2 Nodes 를 설치한다. Comfyui 를 재 실행하면 된다. 2. Workflow  Image Upscale Workflow 위의 이미지를 다운 받아 Comfyui 에 drop 하면 workflow 를 그대로 사용 가능할 것이다. 대부분의 settimg 값을 그대로 두고 이미지를 업로드한 후 실행 하면 upscale 된 이미지를 얻을 수 있다. 다만, SeedVR2 Video Upscaler (v2.5) 노드에 있는 Resolution 값은 확대 했을 때의 이미지 가로 size 이다. Image Comparer (rgthree) 노드는 기존이미지와 생성된 이미지의 품질 차이를 비교하기 위한 노드이다. 3. Upscale 실행 결과비교 원본이미지 1080으로 Upscale 한 결과 좌: Upscale, 우: 원본           만족할 수준의 결과로 Upscale 을 아주 잘 해준다. 좌 : Upscale , 우 : 원본 작은 사진을 그냥 확대하면 선명도가 많이 떨어지는데 보는것처럼 선명하게 확대가 된다. 좌 : Upscale , 우 : 원본 소피마르소의 리지시절 사진이다.  오랜 사진이다 보니 저품질의 사진인데 이것을 Upscale 한 결과이다.  아주 만족 할 만한 결과이다. AI 이미지 인데 , 우측 원본에 비하여 좌측 이미지가 확...

이미지 색상 그리고 조명 효과 편집 Lora - QWEN-Image-Edit-2509 를 이용한 이미지 편집

 이미지 색감과 조명 효과는 이미지의 느낌을 결정하는 매우 중요한 요소이다. 이미지 또는 사진의 조명을 편집하면 좀 더 예술적이고 멋진 이미지가 된다.  이것을 쉽게 하기 위하여 QWEN-Image-Edit 모델과 Relight Lora 를 적용하여 이미지를 다양하게 편집해 본다. 색감과 조명을 따뜻한 것으로 변경한 이미지 1. 필요한 Lora 다운 및 설치 Qwen-Edit-Relight (236M) : https://huggingface.co/dx8152/Qwen-Image-Edit-2509-Relight/tree/main 에서 다운받아 Loras 폴더에 설치한다. 가급적 Comfyui 는 항상 최신 버전으로 업데이트 하고  Lora 설치후 재 실행한다. 2. Workflow QWEN-Image-Edit-2509 Workflow QWEN-Image-Edit-2509 용 workflow 에서 Lora 만 Qwen-Edit-Relight 를 추가 적용하면 된다. 빠른 실행을 위하여  Qwen-Image-Lightning-4steps-V2.0 Lora 도 적용한다.  그러면 4step 으로도 좋은 이미지를 만들 수 있다. 편집이 필요한 Image 를 하나 입력한다. Step : 4 Sampler : euler (또는 res_2s ) Scheduler : simple (또는 bong_tangent ) 3. 다양한 이미지 편집 실례 Prompt : Keep the composition, pose, size, clothing, and face of the person or background in the image the same, but just change the color or lighting to ( romantic warm light with pinkish highlights and soft glow ). 색감을 로맨틱한 분위기로 변경한 전, 후결과 Prompt : Keep t...