본문 바로가기
Business

누구나 할 수 있는 스테이블 디퓨전 Web UI 초보자 가이드

by 도움되는 보라울K 2024. 9. 24.
반응형

 

안녕하세요 

혹시 AI를 통해서 이미지를 생성하고자 하시나요? 

저도 처음 시작할 때의 막막함을 잘 아는 사람입니다. 저도 처음 AI를 통해서 이미지를 생성하고자 할 때, 수많은 용어와 기능 때문에 혼란스러워했던 기억이 있습니다. 

 

하지만! 걱정 마세요! 

저도 그 과정을 거쳐 이제는 누구나 쉽게 사용할 수 있는 방법을 터득했습니다. 스테이블 디퓨전을 통해 창의적인 작업을 할 수 있는 가능성은 무궁무진합니다. 

 

이 글을 통해서 여러분이 스테이플 디퓨전 WebUI를 쉽게 이해하고 활용할 수 있도록 단계별로 안내해드리도록 하겠습니ㅏ! 

끝까지 읽어주시면, 여러분도 손쉽게 멋진 결과물을 만들어 낼 수 있는 길이 열릴 것입니다. 

 

 

스테이블 디퓨전을 시작하기 위한 필수 준비 

스테이블 디퓨전은 고성능 시스템이 필요 합니다. AI 이미지를 빠르고 효율적으로 생성하려면 다음과 같은 시스템을 갖춰야 합니다. 

권장 시스템 사양 

  • 그래픽 카드 (GPU) : RTX 3060 이상 (VRAM이 12GB 이상이면 더욱 좋습니다.) 
  • RAM : 최소 16GB (AI 모델의 무거운 데이터를 처리하기 위해선 충분한 메모리가 필수적입니다.)

추가로 저장공간도 넉넉할 필요가 있습니다. 체크포인트 및 기타 학습 데이터가 많은 용량을 차지하므로 넉넉한 저장공간이 필요합니다. 

또한, Stable Diffusion WebUI라는 사용자 인터페이스를 설치해야 이미지를 설치할 수 있습니다. 

설치 방법은 여기 아래 버튼을 통해서 확인할 수 있습니다. 

 


스테이블 디퓨전의 기본 개념 이해하기 

오늘은 기본 개념만 이해하더라도 어느정도 퀄리티가 좋은 이미지를 생성할 수 있게되는 기본 필수 개념에 대해서 이야기 해드려보도록 하겠습니다.

 

스테이블 디퓨전을 효과적으로 사용하려면 몇가지 중요한 개념을 이해해야 합니다.

이 개념들을 바탕으로 다양한 스타일과 디테일을 조절할 수 있게 됩니다. 

 

1. 프롬프트 (Prompt) : 텍스트로 이미지 만들기 

프롬프트는 스테이블 디퓨전에서 이미지를 생성할 때 가장 기본이 되는 요소입니다.

사용자는 원하는 이미지의 설명을 텍스트로 입력하고, AI는 그 텍스트를 해석하여 이미지를 생성하게 됩니다. 

예를 들어, "Sunset over the ocean with a mountain in the background" 라는 프롬프트를 입력하여 AI는 해당 내용을 기반으로 아래오 같은 이미지를 만들어 냅니다. 이렇게 그럴싸한 이미지가 바로 만들어집니다. 

노을지는 해변의 모습

 

 

프롬프트는 크게 PostiveNegative 프롬프트로 나뉩니다. 

  • Positive Prompt: 포함하고 싶은 요소나 특징을 설명하는 부분
  • Negative Prompt: 배제하고 싶은요소를 설명하는 부분

즉 둘다 중요한 요소로써 더욱 디테일하고 원하는 이미지를 생성할 때 이 프롬프트를 잘 입력해야 합니다. 

프롬프트의 문장 구조와 단어 선택에 따라 이미지의 결과물이 크게 달라질 수 있습니다.

프롬프트는 세밀하게 작성할수록 원하는 결과에 가까워지게 됩니다. 

 

그리고 각각의 프롬프트에 제가 항상 넣는 프롬프트가 있습니다. 기본적으로 좋은 퀄리티를 만들수 있게 해주는 단어들이기 때문에 한번 직접 사용해보시고 사용여부를 결정해보세요 

Positive : masterpiece, (photorealistic:1.4),best quality, ultra high res, extremely detailed 

 

Negative : nsfw, lowers, bad anatomy, bad hands, text, error, missing fingers, missing arms, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, extra arms, extra fingers

 

 

 

2. 체크포인트 (Checkpoint) : 스타일의 결정 요소 

체크포인트는 스테이블 디퓨전에서 이미지를 생성할 때, 어떤 스타일로 생성할지를 결정하는 모델을 뜻합니다. 

각 체크 포인트는 특정 데이터 셋을 기반으로 학습된 AI모델로서, 그림을 그리는 "화가"와 같은 역할을 합니다. 

아래의 예시처럼 같은 프롬프트를 입력하더라도 A라는 체크포인트와 B라는 체크포인트가 이렇게 다른 이미지를 생성합니다. 

똑같이 "1girl, Korean idol style fashion model," 라는 프롬프트를 입력하고 어떻게 다른지 보겠습니다. 

다른 설정을 하지 않아서 당연히 다른 포즈에 이미지가 생성되지만, 얼굴 생김새나, 표현하는 방식이 다른걸 확인할 수 있습니다. 

생성형 ai로 만든 머리에 노란 천을 두루고 있는 여성 이미지생성형 ai로 만든 손을 머리에 대고 있는 여성 이미지

 

이 체크포인트는 CivitAi 와 같은 사이트데서 다운로드 할 수 있으며, 어떤 체크포인트들이 있는지 확인할 수 있습니다.

이를 활용해서 다양한 체크포인트를 통해 다양한 스타일을 실험해 볼 수 있습니다. 

 

 

 

3. LoRA( Low-Rank Adaptation): 디테일을 더하는 요소 

LoRA(로라)는 체크포인트와 함께 사용되어 더 세밀한 스타일과 디테일을 추가해주는 요소입니다. 

이 모델은 특히 세부적이 요소들을 조정하는데 탁월한 성능을 발휘합니다. 

로라는 AI 모델을 더욱 가볍게 만들고, 효율적으로 학습하는 것을 돕습니다.

이로 인해 체크포인트보다 더욱 가벼운 용량으로 다양한 스타일의 이미지를 얻을 수 있게 됩니다. 

그래서 똑같은 체크포인트에서도 아래 보시는 것과 같이 로라에 따라서 다양한 스타일을 생성할 수 있습니다. 

로라를 적용하지 않은 여성 이미지 로라 스타일을 적용한 이미지1 로라 스타일을 적용한 이미지2

4. VAE (Variational Auto Encoder) : 이미지의 화질과 색감을 담당하는 요소 

이미지의 화질과 색감을 최종적으로 보정하는 역할을 하는 것이 VAE입니다. 

생성된 이미지의 퀄리티를 높이고, 색상을 보정하고 보다 선명하고 정확하게 표현할 수 있도록 도와줍니다. 

 

그러나 요즘 나오는 체크포인트에 대부분의 VAE가 포함되어 있어서, 최근에는 사용자가 별로도 설정할 필요가 없는경우가 많지만, 기본 개념으로써 설명을 드려봤습니다. 

반응형

 

5. ControlNet : 이미지 제어의 끝판왕 

ControlNet은 스테이블 디퓨전의 확장 기능의 하나로 더 정밀하게 이미지의 모양이나 구성을 제어할 수 있게 합니다. 예를 들어 원하는 포즈에 원하는 모델의 얼굴을 넣고 싶을때, 어떤 특정한 형태나 구조를 가진 이미지를 만들고 싶을때, 등 이 기능을 통해서 사용하게 됩니다. 

 

이 기능은 복잡한 이미지나 특정 요구사항을 충족하는 이미지가 필요할 때 많이 쓰이는 기능이기 때문에 다음에 더 제대로 다뤄볼 예정입니다. 

 


스테이블 디퓨전의 최신 활용 사례 

스테이블 디퓨전은 그 자체로 강력한 도구일 뿐만 아니라, 여러 산업에서 다양하게 활용되고 있습니다. 특히 광고, 마케팅, 예술, 게임 디자인, 심지어는 제품 디자인에서도 유용하게 쓰입니다.  그 중에서도 스테이블 디퓨전은 다음과 같은 분야에서 큰 변화를 이끌고 있습니다. 

 

1. 마케팅 

소상공인부터 기업까지 비즈니스의 규모에 국한하지 않고, 모든 비즈니스에서 효율적으로 이미지를 생성하고 고객 데이터를 바탕으로 맞춤형 이미지를 생성해 마케팅 캠페인을 진행할 수 있습니다.

예를 들어 미용숍의 경우, 손님들에게 양해를 구하면서 머리 모델을 요청할 필요 없이, 아름답고 멋진 모델이 다음 이미지와 같은 모델로서의 역할을 할 수 있게 됩니다. 

Ai로 만든 헤어모델

 

 

2. 콘텐츠 제작 시간 단축 

전통적인 방법으로 이미지를 제작하는 데 소요되는 시간을 AI가 크게 줄여줍니다. 특히 빠르게 제작해야 하는 광고나 소셜 미디어 콘텐츠 제작에 스테이블 디퓨전이 효과적입니다. 

예전에는 하나의 제품이미지를 생성하는데 스튜디오, 제품, 공간, 배경 등 들어가는 비용도 시간도 많았지만, 지금은 엄청 짧은 시간 안에 브랜드의 제품을 멋지게 소개할 수 있는 이미지를 생성할 수 있습니다. 

 

 

 

 

결국에는 스테이블 디퓨전은 텍스트만으로도 놀라운 이미지를 생성할 수 있는 매우 유용한 도구입니다.

기본적인 개념을 잘 이해하고, 체크포인트와 로라 같은 기능을 잘 이해하고 활용하시다면 누구나 자신만의 독창적인 이미지를 만들어낼 수 있습니다. 또한 이를 상업적, 창의적 목적으로 활용하면 큰 성과를 얻을 수 있습니다. 

 

좀 더 실습을 해보고 싶으신 분들은 아래 유튜브를 보시면 도움이 되실 것 같아 공유해드립니다. 

 

Youtube 출처 : 뉴럴닌자 - AI공부

 


함께 읽으면 좋은 글들 

2024.09.23 - [Business] - ChatGPT를 잘 활용하기 위한 프롬프트 팁 대방출

 

ChatGPT를 잘 활용하기 위한 프롬프트 팁 대방출

혹시 Chat GPT를 사용하고 계신가요? 근데 여전히 원하는 답을 얻기 어려우신가요?? 특최근 ChatGPT-4o가 무료로 출시되면서, 과거 유료버전에서만 제공되었던 이미지 생성이라던지, GPT store 이런 기

blog.boraul.com

 

 

 

Stable Diffusion(스테이블 디퓨젼)이란? 내 비즈니스에 활용방법은?

스테이플 디퓨전이란 무엇인가? 스테이블 디퓨전은 요즘 각광 받는 AI 이미지 생성 기술 중 하나로, 이미지 처리 분야에서 선두분야를 달리고 있는 모델입니다. 딥러닝 기술의 일종으로 입력한

boraul.tistory.com

 

반응형

댓글