기본 콘텐츠로 건너뛰기

스테이블 디퓨전 3.5 large 모델 - Stable Diffusion 3.5 Large 모델 다운 및 사용

 스테이블 디퓨전 3.5 Large 모델이 출시 되었다.

Stable Diffusion 3.5 Large 및 Stable Diffusion 3.5 Large Turbo를 포함하여 출시 되었으며. Stable Diffusion 3.5 Medium은 10월 29일에 출시 예정이라고 한다.
그리고 출시되는 모델 모두 상업적, 비상업적 사용 모두 무료로 제공된다고 한다.
사실 SD3.0 버전은 기대에 못 미치는 모델로 평가되어 비판을 많이 받았던 모델이다. 저 또한 SD3.0 을 잠깐 사용해 보았는데 차라리 SDXL 버전을 사용하는 것이 더 좋았기 때문에 테스트 후 사용해 보지 않았다.   이번에는 Stability AI 사 에서 야심차게 준비해서 출시 하였다고 하니 한번 사용해 보자.
Release Stable Diffusion 3.5

1. Stable Diffusion 3.5 Large 다운로드 및 설치

  • CIVITAI 사이트에 접속
  • Stable Diffusion 3.5 로 검색하면 모델이 나온다.
  • Large 모델(15.xx G)을 다운 받는다. 물론 Large Turbo 모델을 다운받아 사용해도 된다.
  • 다운받은 파일은 ( ..\comfyui\models\checkpoints ) 폴더에 설치 하면 된다.

2. clip_g.safetensors 다운로드 및 설치

  • clip_g.safetensors 다운로드 : https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/blob/main/text_encoders/clip_g.safetensors
  • 만약 Flux 를 사용해 본적이 없다면 아래 두개의 clip 모델도 다운 받아 설치 해야된다.
  • clip_l.safetensors 다운로드 :  https://huggingface.co/comfyanonymous/flux_text_encoders/blob/main/clip_l.safetensors
  • t5xxl_fp16.safetensors 다운로드: https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/blob/main/text_encoders/t5xxl_fp16.safetensors
  • 다운받은 파일들은 ( ..\comfyui\models\clip ) 폴더에 설치 하면 된다.

3. Comfyui Workflow 구성

  • 다른 노드들은 기존 Stable Diffusion 의 기본적인 workflow 그대로 사용해도 된다.  다만 Clip 모델들은 별도 노드에 올려서 사용한다.

TripleCLIPLoader
3개의 CLIP 모델들을 동시에 사용해야 한다.
  • 다음은 완성된 기본 Stable Diffusion 3.5 버전용 Workflow 이다.


SD3.5 용 Workflow

4. 이미지 생성

    기본적인 workflow 에서 몇 가지 이미지를 만들어 보았다.
  • Prompt : Surreal, abstract painting featuring two black cats with exaggerated, whimsical features. The larger cat stands upright on two legs, with a tall, slender body and a large, round head with wide, expressive eyes. The smaller cat sits on all fours, looking up at the larger cat. Both cats have spiky, unkempt fur and long, thin tails. The background is a mix of earthy tones, with splashes of orange, brown, and gray, creating a textured, dreamlike atmosphere. 

two black cats
  • Prompt : background in spiral voronoi nebulae and galaxies and moon, Best looking woman in the world There is sun in her hair, with perfect composition, insanely detailed, highly detailed, good quality full HD,  brown skin, a sharp small nose, a black transparent shawl, brown eyes, a modest long full-sleeved black dress

galaxies background, woman
  • Prompt : cinematic style lifestyle photography of a skinny korean woman, with (chignon cut hair) Wearing a protective biohazard suit ,dressed in black sleeveless top,black leather pants, string  necklace, relaxed demeanor,daylight shot,eye-level angle,hunting pose, holding pistol, centered framing,((in a lost temple in the jungle:1.3)), big depth of field ,shocked green tattoo on arm

korean woman
  • Prompt : A watercolor and ink sketch of a serene lakeside landscape at sunset.  with tall grasses and reeds in the foreground, reflected perfectly in the still lake water. Beyond the lake, dense forests of trees rise.  The style is a blend of detailed graphic sketching and ink and wash watercolor, giving the landscape depth and texture.

Watercolor and ink sketch

5. 사용 후기

    많은 준비를 하여 출시된 모델이지만 ,  만들어진 이미지들의 Quality 와 이미지 생성 속도를 고려 했을때 실망스럽지도 감탄스럽지도 않는 수준이다.
기존 3.0 보다는 더 세련되고 화질도 더 좋아 졌는데, Flux 모델의 수준과 비교 했을 때 아직 까지는 더 낫다고 평가하기는 어렵다.  물론 아직 Stable Diffusion 3.5 버전을 사용해야 할 조건들이 갖추어 지지 않는 상태에서 기존 SDXL를  사용 했던 workflow 에서 사용 했기 때문에 SD3.5 의 특징이 잘 나타나지 않았을 수 도 있다. 좀 더 Stable Diffusion 3.5 에 맞는 플랫폼이 형성 되고 Lora 모델들과 개선된 모델들이 계속 나온다면 지금 보다는 더 좋은 이미지를 만들 수 있지 않을까 도 판단해 본다.  나도 좀 더 사용해 보고 계속 사용해도 좋은 지를 판단해야 할 것 같다.   그래도 이런 개선된 모델들이 계속 출시된다는 것을 고무적인 일이고 이미지 생성 AI 의 발전이 훨씬 더 빨라 질 것으로 생각한다.

댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Controlnet 적용 방법 - Comfyui 에서 사용

Flux에서도 이제 Controlnet 기능을 사용할 수있다. Comfyui 에서 Stable Diffusion 과 같은 방식으로 사용 할 수 있는  controlnet 모델들이 출시 되었다. 1. Controlnet 이란 ?      ControlNet은 Stable Diffusion 과 같은 이미지 생성 모델에서 조건부 입력 을 추가하여 결과 이미지를 더 세밀하게 제어할 수 있게 한다. 예를 들어, 포즈 , 스케치 , 엣지 지도(edge map) 등을 입력으로 받아 생성된 이미지를 밑그림으로 이미지에 반영할 수 있다.  2. Flux용 Controlnet 모델     Stable Diffusion 용 Controlnet 모델들은 Canny, Depth, Hed, Scribble, Open Pose, Sketch 등 여러가지 모델들이 있는데 Flux 용 모델들은 그 중에서 Canny, Depth, Hed 3가지 종류의 모델들만 출시되었다. 각각의 적용하는 대상은 어떤 이미지를 생성 하는가에 따라 적합한 것을 사용하면 되는데 3가지 모델들이 서로 다른 듯 비슷한 기능들이 섞여 있어서 많은 시행을 해 본 후 더 적합한 모델들을 사용하기를 권한다. 3. Controlnet 적용 기본     Controlnet 의 적용은 먼저 원본 이미지가 필요하고 그것을 Controlnet 모델들이 인식할 수 있도록 바꾸어 주는 전처리기를 통과한 후 Controlnet 모델들을 선택하여 이  이미지를 적용하여 Sampler에 입력한다. 이를 간단하게 workflow 를 구성하면 다음과 같다. 기본 Controlnet Workflow 전처리기는 Controlnet 모델별로 각각 다른 전처리기를 사용하기 때문에 항상 모델에 맞는 전처리기를 사용하여야 올바른 이미지를 얻을 수 있다. 4. Controlnet 모델 과 필수Nod 다운로드 및 설치     다운로드는 huggingf...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...