기본 콘텐츠로 건너뛰기

Dall-E3 에 대하여 그리고 Copilot 에서 사용해 보기

 Dall-E3 는 OpenAI가 개발한 최신 버전의 텍스트 기반 이미지 생성 모델이다.

Text (Prompt) 입력 만으로 거의 모든 상상할 수 있는 이미지를 만들어 주는 이미지 생성형 AI 이다.  Midjourney, Stable Diffusion, Flux, Playground 와 마찬가지로 멋진 이미지를 만들어 주는 AI 이다.  DALL-E 3는 이전 버전과 비교하여 더 정교한 이미지를 생성할 수 있으며, 사용자 의도를 보다 정확하게 반영할 수 있는 것이 큰 특징이다.  그리고 OpenAI 사는 ChatGPT를 개발한 회사이기 때문에 chatGPT plus 에서 곧 바로 Dall-E3 를 이용하여 이미지를 만들 수 있다.  물론 이 경우에는 유료로 사용해야 한다.  이 글에서는 무료로 사용이 가능한 Copilot 에서 사용하는 방법을 소개 할 것이다.

1. Dall-E3 의 특징과 다른 AI 와의 차별성

  • 텍스트 해석 능력 : DALL-E 3는 텍스트 설명을 매우 구체적이고 정교하게 해석하여 이미지에 반영한다. 이전 버전이나 다른 AI 모델과 달리, 복잡한 장면이나 여러 요소가 포함된 이미지를 생성하는 데 있어서 높은 정확도로 이미지를 만들어 준다.  예를 들어, "푸른 하늘 아래 있는 노란색 꽃이 핀 들판에서 뛰어노는 강아지"라는 설명을 주면, 해당 장면의 세부 사항을 정확하게 반영한 이미지를 생성해 준다. 다른 AI 는 비슷한 느낌의 이미지는 만들어 주지만 정확성이 좀 떨어진다.
  • 인체의 디테일 한 표현 : 다른 AI 모델들이 인체 표현에서 종종 왜곡되거나 부자연스러운 이미지를 생성하는 문제를 겪었던 반면, DALL-E 3는 인체 비율이나 손과 같은 디테일한 부분에서 훨씬 더 자연스러운 이미지를 생성한다.  특히 다른 AI 에서 이미지를 만들다 보면 손 모양이 잘 나오기가 어렵다.
  • 고해상도 이미지 생성 : 고해상도 이미지를 생성하는 데 있어서 다른 모델에 비하여 뒤 떨어지지 않는 이미지를 만들어 준다.  이를 통해 상업적 사용이나 대형 인쇄물을 위한 이미지 제작에 이용해도 된다.
  • 문자 표현 능력 : Prompt 에서 요구한 문자열을 비교적 정확하게 표현 해 준다.  Stable Diffusion 인 경우는 문자 표현이 거의 어렵고, Midjourney 나 Flux 는 문자를 잘 표현해 주는 AI 모델들인데  Dall-E3가 좀 더 정확하게 표현 해 준다.
  • 안전 필터링 기능 : 강화된 안전 필터링 기능을 도입하여, 부적절하거나 유해한 콘텐츠의 생성을 막고 있다. 이는 사용자가 AI를 보다 안전하게 사용할 수 있도록 보장해 준다.  이 부분은 장점 일수도 단점 일수도 있다.  청소년들이 사용하기에 전혀 유해 하지 않는 건전한 AI 일 수 있지만 성인물은 만들 수 없다는 것은 도 하나의 제약 일 수도 있다.

2. Copilot 에서 Dall-E3 사용해 보기

  • Google 에서 "copilot designer": 로 검색한다.
  • Microsoft Copilot 클릭해서 접속 한다.
  • 가입 및 만들기 클릭 하여 개인계정 (google 계정)으로 들어간다.
  • Prompt 입력란에 그리고 싶은 내용을 입력하고 만들기를 클릭 하면 이미지를 만들어 준다.
  • 생성된 이미지는 1024x1024 로 4장을 만들어 준다.  이것들을 다운 받아 사용하면 된다.
  • Prompt 는 영어로 입력해도 되고 그냥 한글로 입력 하여도 만들어 준다. 100개 이상의 언어로 지원 된다고 하니 이 부분은 영어권이 아닌 사람들에게 는 참 편리한 기능이다.
  • 만약 초보자인 경우 prompt(명령어)를 만들기가 어렵다면 다른 사람들이 만든 작품들을 살펴보고 그것을 참고하여 만들면 된다.
  • 자신이 만든 과거의 작품들도 모두 저장되기 때문에 참고할 수 있다.
prompt 입력란에 여러가지를 입력해서 만들어 보면 AI를 이용한 이미지 생성이 매우 쉽다는 것을 느낄 수 있을 것이다.

3. Dall-E3 실습 사례

  • prompt : "무지개 빛 우아한 옷을 입고 테이블에 앉아서 커피를 마시는 아름다운 젊은 한국 여성을 그려줘 .  테이블 위에는 예쁜 꽃들이 있는 화병이 있고 여성 주위에도 꽃들이 있는 집안 정원에서 의 이미지"

Dall-E3 이미지
대체적으로 Prompt 에 요구하는 내용대로 이미지가 잘 만들어 졌다.
결과 이미지 4장중 마음에 드는 한장이다.  이 이미지의 prompt 들을 조금씩 변경하면서 자신이 원하는 이미지를 만들면 된다.
  • prompt : "따뜻한 커피가 들어있는 예쁜 커피잔이 있고 부드럽게 수증기가 위로 올라가고 있으며 커피위에  "Dall-E3" 가 써 있는 모습을 위에서 촬영한다 ."
이번에는 글자가 들어 있는 prompt 를 입력 해 보았다.
Dall-E3 글자 표현
prompt 대로 이미지가 잘 만들어 졌다.  특히 글자도 정확하게 표현 해 준다.  다른 AI 에서는 물론 문자 표현이 가능하지만 정확도 면에서 있어서 Dall-E3 가 더 좋다고 생각한다.

4. Dall-E3 의 아쉬운 점

    Dall-E3 도 다른 AI 에 비교하여 좋은 이미지 생성형 AI 라고 생각이 든다.  하지만 생성되는 이미지의 크기가 1024x1024 로 정해졌기 때문에 많이 아쉬운 부분이다.  만드는 prompt 가 동일하다면 생성된 이미지들도 거의 비슷하다.  AI 모델이나 Lora 나 다른 확장된 기능을 보완하여 사용하기가 어렵기 때문에 나만의 독특한 이미지를 만들기가 어렵다고 생각한다.

5. Dall-E3 사용후기

    정사각형의 이미지만 만들 수 있고 , 정해진 모델로 만 만들기 때문에 아쉽지만 그러나 여러가지 간단한 이미지가 필요한 학생들이나 개인 사업자들에게 는  쉽게 접근하여 자기가 원하는 방향의 고급이미지를 만들 수 있는 좋은 AI 모델이라고 생각한다.
특히 AI를 이용한 이미지 생성에 초보자들 에게 는 손 쉽게 훈련 할 수 있고 배울 수 있는 툴이다.  다만 무료인 경우 하루 생성 해 볼 수 있는 횟수가 15 회 정도 15회 x 4장 = 60 장 이다.  15회가 초과해도 만들어 줄 것이지만 생성 속도가 느려진다고 알고 있다.
오늘도 행복한 하루 보내세요.

댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...