기본 콘텐츠로 건너뛰기

이미지 생성형 AI란 무엇인가?

 생성형 AI(Generative AI)는 기존의 데이터를 학습하여(딥러닝) 새로운 콘텐츠를 만들어내는 인공지능 기술을 말합니다. 생성형 AI는 예술, 디자인, 음악, 글쓰기 등 다양한 창작 분야에서 새로운 아이디어를 만들어 주고 다양한 발전 가능성을 열고 있습니다. 

그중에서 특히 text 나 image 를 입력하여 새로운 image 를 만들어 내는 것을 이미지 생성형 AI 라고 부르며 대표적으로는  Midjourney,  Dall-E3, Stable Diffusion과 Flux 등이 있다. 이미지 생성형 AI 모델은 예술과 기술의 경계를 모호하게 만들고  많은 사람들에게 창작과 업무 서포터로써의 새로운 도구로 자리 잡았습니다.


1. 이미지 생성형 AI의 작동 원리

이미지 생성형 모델은 Diffusion Models(확산모델) 이라는 최신 AI 기술을 사용하고 있는데   확산 모델은 노이즈에서 부터 단계별로 노이즈를 제거함으로써 최종적으로 이미지를 복원하는 과정을 통해 이미지를 생성합니다. 처음에는 매우 Random Nose(무작위적인 노이즈)가 있는 상태에서 시작하지만, 점차적으로 노이즈를 제거하며 최종적으로 선명한 이미지를 생성합니다.

더 자세한 사항은 읽어도 뭔 소린지 이해하기가 어려워 이 정도로만 이해하고 사용하면 됩니다. 


2. 대표적인 이미지 생성형 AI

    모두 텍스트(Prompt)를 입력하여 이미지를 생성하는 방법은 동일하다. 좀 더 응용하면 이미지와 텍스트를 입력하고 새로운 이미지를 만들어 냅니다.

  -. MidJourney: 이미지의 품질이 좋고 예술적이고 창의적인 이미지 생성에 특화된 AI 로 개인적으로는 가장 앞서있는 이미지 AI 라고 생각한다. 다만 오픈소스가 아니며 유료로만 사용이 가능하다. 그래서 좀 더 예술적 스타일 선호 시 추천.

  -. DALL-E 3: OpenAI에서 개발한 텍스트 프롬프트를 기반으로 사실적이고 디테일한 이미지를 생성한다.  품질도 좋고 무료사용도 가능하지만 아직은 이미지 사이즈가 획일적이고 품질은 약간 부족하다는 생각이다.  상당히 prompt의 지시대로 잘 그려주는 스타일이다. 쉽게 접하고 쉽게 사용해 보기 좋은 모델이다.

  -. Stable Diffusion: 오픈소스 모델로 무료사용이 가능하고 품질도 괜찮고 개인이 자유롭게 사용할 수있는 AI지만 고성능의 컴퓨터가 필요하다. 데스크탑 컴퓨터로 200만원 이상정도는 되어야 불편함이 없이 어느정도의 이미지를 만들 수있다. 특히 확장성이 좋아 어느 정도 숙달이 되면 자기가  원하는 품질좋은 이미지를 만들어 낼 수있다.  컴퓨터를 어느정도는 아는 사람들에 권하고 싶다.

  -. Flux: 스테이블디퓨전과 유사한 최근에 나온 모델인데 품질은 미드저니와 유사하고 오픈소스 모델도 있어서 개인이 자유롭게 사용하여 이미지를 만들 수있다. 단점은 스테이블디퓨전 보다 모델의 크기가 2배이상이여서 좀 더 고사양의 컴퓨터가 필요하다. 스테이블디퓨전을 먼저 접한 후 Flux를 사용하기를 권한다.


4. 이미지 생성형 AI의 장점과 한계

이미지 생성형 AI의 가장 큰 장점은 인간이 수작업으로 만들어낼 수 없거나 시간이 많이 걸리는 사진이나 이미지들을 빠르게 생성할 수 있다는 것입니다. 이는 창의적인 작업을 지원하고, 새로운 아이디어를 만들어내는데 유용합니다. 또한, AI 모델이 계속해서 발전함에 따라 이미지 생성형 AI는 더 사실적이고 더 품질이 좋은 결과물을 만들어내고 있으며, 이는 미술가, 디자이너, 사진 작가 등  이미지 창작자들에게 새로운 영감을 제공합니다.

하지만 이미지 생성형 AI에는 몇 가지 한계도 존재합니다. 우선, AI가 기존에 존재한 자료로부터 학습한 데이터에 따라 편향된 결과물이 나올 수 있습니다. 또한, 유사한 이미지 스타일이 만들어져 저작권 문제가 발생할 수 있습니다.  이것은 AI가 학습하는 데이터는 종종 기존의 저작권이 있는 작품들도 포함하여 학습을 시키기 때문입니다. 이것은 단지 이미지 생성형AI 의 문제만이 아닌 모든 생성형 AI의 사용에 있어 법적, 윤리적 문제를 반드시 고려하는 것이 중요합니다.

5. 향후 전망

이미지 생성형 AI는 앞으로 더욱 발전할 가능성이 큽니다. 이미지는 거의 예술가 수준에 근접한 상태이며  지금은 동영상 분야로 확대되고 있습니다. 머지않아 생성형 AI 로 만든 멋진 영화가 탄생할 것으로 생각합니다.  그리고 개인 사용자부터 대규모 산업까지 다양한 분야에서 이런 생성형 AI 기반 창작 도구를 활용할 것으로 예상됩니다.  Midjourney , Dall-E3 , Stable Diffusion과 Flux 같은 도구들이 더욱 정교해지고 사용자 친화적으로 발전함에 따라 현실과 환상의 경계를 구분하기가 어려워 질 것입니다.

발전의 속도가 예측하기 어려운 속도가 빠르기 때문에 우리도 거기에 적응하기 위해서는 직접 사용을 해보고 함께 하여야 한다고 생각합니다.

두려움을 가지고 접근하지 않는다면 미래에는 AI 를 전혀 모르는 문맹자가 될 수도 있습니다. 우선은 쉬운것 부터 해보는것이 좋을것이고 그것이 바로 이미지를 만드는 AI 들 이라고 생각합니다.

.

Dall-E3 에서 만든 AI 사진


stable diffusion 에서 만든 AI사진

Flux로 만든 AI 사진







댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Controlnet 적용 방법 - Comfyui 에서 사용

Flux에서도 이제 Controlnet 기능을 사용할 수있다. Comfyui 에서 Stable Diffusion 과 같은 방식으로 사용 할 수 있는  controlnet 모델들이 출시 되었다. 1. Controlnet 이란 ?      ControlNet은 Stable Diffusion 과 같은 이미지 생성 모델에서 조건부 입력 을 추가하여 결과 이미지를 더 세밀하게 제어할 수 있게 한다. 예를 들어, 포즈 , 스케치 , 엣지 지도(edge map) 등을 입력으로 받아 생성된 이미지를 밑그림으로 이미지에 반영할 수 있다.  2. Flux용 Controlnet 모델     Stable Diffusion 용 Controlnet 모델들은 Canny, Depth, Hed, Scribble, Open Pose, Sketch 등 여러가지 모델들이 있는데 Flux 용 모델들은 그 중에서 Canny, Depth, Hed 3가지 종류의 모델들만 출시되었다. 각각의 적용하는 대상은 어떤 이미지를 생성 하는가에 따라 적합한 것을 사용하면 되는데 3가지 모델들이 서로 다른 듯 비슷한 기능들이 섞여 있어서 많은 시행을 해 본 후 더 적합한 모델들을 사용하기를 권한다. 3. Controlnet 적용 기본     Controlnet 의 적용은 먼저 원본 이미지가 필요하고 그것을 Controlnet 모델들이 인식할 수 있도록 바꾸어 주는 전처리기를 통과한 후 Controlnet 모델들을 선택하여 이  이미지를 적용하여 Sampler에 입력한다. 이를 간단하게 workflow 를 구성하면 다음과 같다. 기본 Controlnet Workflow 전처리기는 Controlnet 모델별로 각각 다른 전처리기를 사용하기 때문에 항상 모델에 맞는 전처리기를 사용하여야 올바른 이미지를 얻을 수 있다. 4. Controlnet 모델 과 필수Nod 다운로드 및 설치     다운로드는 huggingf...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...