스테이블 디퓨전 3.5 Large 모델이 출시 되었다.
Stable Diffusion 3.5 Large 및 Stable Diffusion 3.5 Large Turbo를 포함하여 출시 되었으며. Stable Diffusion 3.5 Medium은 10월 29일에 출시 예정이라고 한다.
그리고 출시되는 모델 모두 상업적, 비상업적 사용 모두 무료로 제공된다고 한다.
사실 SD3.0 버전은 기대에 못 미치는 모델로 평가되어 비판을 많이 받았던 모델이다. 저 또한 SD3.0 을 잠깐 사용해 보았는데 차라리 SDXL 버전을 사용하는 것이 더 좋았기 때문에 테스트 후 사용해 보지 않았다. 이번에는 Stability AI 사 에서 야심차게 준비해서 출시 하였다고 하니 한번 사용해 보자.
1. Stable Diffusion 3.5 Large 다운로드 및 설치
- CIVITAI 사이트에 접속
- Stable Diffusion 3.5 로 검색하면 모델이 나온다.
- Large 모델(15.xx G)을 다운 받는다. 물론 Large Turbo 모델을 다운받아 사용해도 된다.
- 다운받은 파일은 ( ..\comfyui\models\checkpoints ) 폴더에 설치 하면 된다.
2. clip_g.safetensors 다운로드 및 설치
- clip_g.safetensors 다운로드 : https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/blob/main/text_encoders/clip_g.safetensors
- 만약 Flux 를 사용해 본적이 없다면 아래 두개의 clip 모델도 다운 받아 설치 해야된다.
- clip_l.safetensors 다운로드 : https://huggingface.co/comfyanonymous/flux_text_encoders/blob/main/clip_l.safetensors
- t5xxl_fp16.safetensors 다운로드: https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/blob/main/text_encoders/t5xxl_fp16.safetensors
- 다운받은 파일들은 ( ..\comfyui\models\clip ) 폴더에 설치 하면 된다.
3. Comfyui Workflow 구성
- 다른 노드들은 기존 Stable Diffusion 의 기본적인 workflow 그대로 사용해도 된다. 다만 Clip 모델들은 별도 노드에 올려서 사용한다.
TripleCLIPLoader |
- 다음은 완성된 기본 Stable Diffusion 3.5 버전용 Workflow 이다.
SD3.5 용 Workflow |
4. 이미지 생성
기본적인 workflow 에서 몇 가지 이미지를 만들어 보았다.
- Prompt : Surreal, abstract painting featuring two black cats with exaggerated, whimsical features. The larger cat stands upright on two legs, with a tall, slender body and a large, round head with wide, expressive eyes. The smaller cat sits on all fours, looking up at the larger cat. Both cats have spiky, unkempt fur and long, thin tails. The background is a mix of earthy tones, with splashes of orange, brown, and gray, creating a textured, dreamlike atmosphere.
two black cats |
- Prompt : background in spiral voronoi nebulae and galaxies and moon, Best looking woman in the world There is sun in her hair, with perfect composition, insanely detailed, highly detailed, good quality full HD, brown skin, a sharp small nose, a black transparent shawl, brown eyes, a modest long full-sleeved black dress
galaxies background, woman |
- Prompt : cinematic style lifestyle photography of a skinny korean woman, with (chignon cut hair) Wearing a protective biohazard suit ,dressed in black sleeveless top,black leather pants, string necklace, relaxed demeanor,daylight shot,eye-level angle,hunting pose, holding pistol, centered framing,((in a lost temple in the jungle:1.3)), big depth of field ,shocked green tattoo on arm
korean woman |
- Prompt : A watercolor and ink sketch of a serene lakeside landscape at sunset. with tall grasses and reeds in the foreground, reflected perfectly in the still lake water. Beyond the lake, dense forests of trees rise. The style is a blend of detailed graphic sketching and ink and wash watercolor, giving the landscape depth and texture.
Watercolor and ink sketch |
5. 사용 후기
많은 준비를 하여 출시된 모델이지만 , 만들어진 이미지들의 Quality 와 이미지 생성 속도를 고려 했을때 실망스럽지도 감탄스럽지도 않는 수준이다.
기존 3.0 보다는 더 세련되고 화질도 더 좋아 졌는데, Flux 모델의 수준과 비교 했을 때 아직 까지는 더 낫다고 평가하기는 어렵다. 물론 아직 Stable Diffusion 3.5 버전을 사용해야 할 조건들이 갖추어 지지 않는 상태에서 기존 SDXL를 사용 했던 workflow 에서 사용 했기 때문에 SD3.5 의 특징이 잘 나타나지 않았을 수 도 있다. 좀 더 Stable Diffusion 3.5 에 맞는 플랫폼이 형성 되고 Lora 모델들과 개선된 모델들이 계속 나온다면 지금 보다는 더 좋은 이미지를 만들 수 있지 않을까 도 판단해 본다. 나도 좀 더 사용해 보고 계속 사용해도 좋은 지를 판단해야 할 것 같다. 그래도 이런 개선된 모델들이 계속 출시된다는 것을 고무적인 일이고 이미지 생성 AI 의 발전이 훨씬 더 빨라 질 것으로 생각한다.
댓글
댓글 쓰기