기본 콘텐츠로 건너뛰기

Dall-E3 에 대하여 그리고 Copilot 에서 사용해 보기

 Dall-E3 는 OpenAI가 개발한 최신 버전의 텍스트 기반 이미지 생성 모델이다.

Text (Prompt) 입력 만으로 거의 모든 상상할 수 있는 이미지를 만들어 주는 이미지 생성형 AI 이다.  Midjourney, Stable Diffusion, Flux, Playground 와 마찬가지로 멋진 이미지를 만들어 주는 AI 이다.  DALL-E 3는 이전 버전과 비교하여 더 정교한 이미지를 생성할 수 있으며, 사용자 의도를 보다 정확하게 반영할 수 있는 것이 큰 특징이다.  그리고 OpenAI 사는 ChatGPT를 개발한 회사이기 때문에 chatGPT plus 에서 곧 바로 Dall-E3 를 이용하여 이미지를 만들 수 있다.  물론 이 경우에는 유료로 사용해야 한다.  이 글에서는 무료로 사용이 가능한 Copilot 에서 사용하는 방법을 소개 할 것이다.

1. Dall-E3 의 특징과 다른 AI 와의 차별성

  • 텍스트 해석 능력 : DALL-E 3는 텍스트 설명을 매우 구체적이고 정교하게 해석하여 이미지에 반영한다. 이전 버전이나 다른 AI 모델과 달리, 복잡한 장면이나 여러 요소가 포함된 이미지를 생성하는 데 있어서 높은 정확도로 이미지를 만들어 준다.  예를 들어, "푸른 하늘 아래 있는 노란색 꽃이 핀 들판에서 뛰어노는 강아지"라는 설명을 주면, 해당 장면의 세부 사항을 정확하게 반영한 이미지를 생성해 준다. 다른 AI 는 비슷한 느낌의 이미지는 만들어 주지만 정확성이 좀 떨어진다.
  • 인체의 디테일 한 표현 : 다른 AI 모델들이 인체 표현에서 종종 왜곡되거나 부자연스러운 이미지를 생성하는 문제를 겪었던 반면, DALL-E 3는 인체 비율이나 손과 같은 디테일한 부분에서 훨씬 더 자연스러운 이미지를 생성한다.  특히 다른 AI 에서 이미지를 만들다 보면 손 모양이 잘 나오기가 어렵다.
  • 고해상도 이미지 생성 : 고해상도 이미지를 생성하는 데 있어서 다른 모델에 비하여 뒤 떨어지지 않는 이미지를 만들어 준다.  이를 통해 상업적 사용이나 대형 인쇄물을 위한 이미지 제작에 이용해도 된다.
  • 문자 표현 능력 : Prompt 에서 요구한 문자열을 비교적 정확하게 표현 해 준다.  Stable Diffusion 인 경우는 문자 표현이 거의 어렵고, Midjourney 나 Flux 는 문자를 잘 표현해 주는 AI 모델들인데  Dall-E3가 좀 더 정확하게 표현 해 준다.
  • 안전 필터링 기능 : 강화된 안전 필터링 기능을 도입하여, 부적절하거나 유해한 콘텐츠의 생성을 막고 있다. 이는 사용자가 AI를 보다 안전하게 사용할 수 있도록 보장해 준다.  이 부분은 장점 일수도 단점 일수도 있다.  청소년들이 사용하기에 전혀 유해 하지 않는 건전한 AI 일 수 있지만 성인물은 만들 수 없다는 것은 도 하나의 제약 일 수도 있다.

2. Copilot 에서 Dall-E3 사용해 보기

  • Google 에서 "copilot designer": 로 검색한다.
  • Microsoft Copilot 클릭해서 접속 한다.
  • 가입 및 만들기 클릭 하여 개인계정 (google 계정)으로 들어간다.
  • Prompt 입력란에 그리고 싶은 내용을 입력하고 만들기를 클릭 하면 이미지를 만들어 준다.
  • 생성된 이미지는 1024x1024 로 4장을 만들어 준다.  이것들을 다운 받아 사용하면 된다.
  • Prompt 는 영어로 입력해도 되고 그냥 한글로 입력 하여도 만들어 준다. 100개 이상의 언어로 지원 된다고 하니 이 부분은 영어권이 아닌 사람들에게 는 참 편리한 기능이다.
  • 만약 초보자인 경우 prompt(명령어)를 만들기가 어렵다면 다른 사람들이 만든 작품들을 살펴보고 그것을 참고하여 만들면 된다.
  • 자신이 만든 과거의 작품들도 모두 저장되기 때문에 참고할 수 있다.
prompt 입력란에 여러가지를 입력해서 만들어 보면 AI를 이용한 이미지 생성이 매우 쉽다는 것을 느낄 수 있을 것이다.

3. Dall-E3 실습 사례

  • prompt : "무지개 빛 우아한 옷을 입고 테이블에 앉아서 커피를 마시는 아름다운 젊은 한국 여성을 그려줘 .  테이블 위에는 예쁜 꽃들이 있는 화병이 있고 여성 주위에도 꽃들이 있는 집안 정원에서 의 이미지"

Dall-E3 이미지
대체적으로 Prompt 에 요구하는 내용대로 이미지가 잘 만들어 졌다.
결과 이미지 4장중 마음에 드는 한장이다.  이 이미지의 prompt 들을 조금씩 변경하면서 자신이 원하는 이미지를 만들면 된다.
  • prompt : "따뜻한 커피가 들어있는 예쁜 커피잔이 있고 부드럽게 수증기가 위로 올라가고 있으며 커피위에  "Dall-E3" 가 써 있는 모습을 위에서 촬영한다 ."
이번에는 글자가 들어 있는 prompt 를 입력 해 보았다.
Dall-E3 글자 표현
prompt 대로 이미지가 잘 만들어 졌다.  특히 글자도 정확하게 표현 해 준다.  다른 AI 에서는 물론 문자 표현이 가능하지만 정확도 면에서 있어서 Dall-E3 가 더 좋다고 생각한다.

4. Dall-E3 의 아쉬운 점

    Dall-E3 도 다른 AI 에 비교하여 좋은 이미지 생성형 AI 라고 생각이 든다.  하지만 생성되는 이미지의 크기가 1024x1024 로 정해졌기 때문에 많이 아쉬운 부분이다.  만드는 prompt 가 동일하다면 생성된 이미지들도 거의 비슷하다.  AI 모델이나 Lora 나 다른 확장된 기능을 보완하여 사용하기가 어렵기 때문에 나만의 독특한 이미지를 만들기가 어렵다고 생각한다.

5. Dall-E3 사용후기

    정사각형의 이미지만 만들 수 있고 , 정해진 모델로 만 만들기 때문에 아쉽지만 그러나 여러가지 간단한 이미지가 필요한 학생들이나 개인 사업자들에게 는  쉽게 접근하여 자기가 원하는 방향의 고급이미지를 만들 수 있는 좋은 AI 모델이라고 생각한다.
특히 AI를 이용한 이미지 생성에 초보자들 에게 는 손 쉽게 훈련 할 수 있고 배울 수 있는 툴이다.  다만 무료인 경우 하루 생성 해 볼 수 있는 횟수가 15 회 정도 15회 x 4장 = 60 장 이다.  15회가 초과해도 만들어 줄 것이지만 생성 속도가 느려진다고 알고 있다.
오늘도 행복한 하루 보내세요.

댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Controlnet 적용 방법 - Comfyui 에서 사용

Flux에서도 이제 Controlnet 기능을 사용할 수있다. Comfyui 에서 Stable Diffusion 과 같은 방식으로 사용 할 수 있는  controlnet 모델들이 출시 되었다. 1. Controlnet 이란 ?      ControlNet은 Stable Diffusion 과 같은 이미지 생성 모델에서 조건부 입력 을 추가하여 결과 이미지를 더 세밀하게 제어할 수 있게 한다. 예를 들어, 포즈 , 스케치 , 엣지 지도(edge map) 등을 입력으로 받아 생성된 이미지를 밑그림으로 이미지에 반영할 수 있다.  2. Flux용 Controlnet 모델     Stable Diffusion 용 Controlnet 모델들은 Canny, Depth, Hed, Scribble, Open Pose, Sketch 등 여러가지 모델들이 있는데 Flux 용 모델들은 그 중에서 Canny, Depth, Hed 3가지 종류의 모델들만 출시되었다. 각각의 적용하는 대상은 어떤 이미지를 생성 하는가에 따라 적합한 것을 사용하면 되는데 3가지 모델들이 서로 다른 듯 비슷한 기능들이 섞여 있어서 많은 시행을 해 본 후 더 적합한 모델들을 사용하기를 권한다. 3. Controlnet 적용 기본     Controlnet 의 적용은 먼저 원본 이미지가 필요하고 그것을 Controlnet 모델들이 인식할 수 있도록 바꾸어 주는 전처리기를 통과한 후 Controlnet 모델들을 선택하여 이  이미지를 적용하여 Sampler에 입력한다. 이를 간단하게 workflow 를 구성하면 다음과 같다. 기본 Controlnet Workflow 전처리기는 Controlnet 모델별로 각각 다른 전처리기를 사용하기 때문에 항상 모델에 맞는 전처리기를 사용하여야 올바른 이미지를 얻을 수 있다. 4. Controlnet 모델 과 필수Nod 다운로드 및 설치     다운로드는 huggingf...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...