요즘 핫한 이미지 생성 AI, 스테이블 디퓨전(Stable Diffusion) 설치하고 무료로 사용하기

2023. 12. 8. 22:31이미지 생성 AI

stability.ai 의 Stable Diffusion XL

 

요즘 핫한 AI 스테이블 디퓨전을 이용해서 이미지를 만들어보고 싶어하는 분들이 많이 있는걸로 알고 있습니다. 스테이블 디퓨전을 개발한 Stability.Ai 에서 운영하는 드림스튜디어(DreamStudio) 에서 편리하게 이미지를 생성할 수 있지만, 유감스럽게도 유료입니다.

 

스테이블 디퓨전은 오픈소스여서 누구나 무료로 사용할 수 있지만, 초보자가 스테이블 디퓨전을 설치하고 사용하는 것은 조금 복잡합니다. 그래서 오늘은 맥컴퓨터에 직접 설치하고 무료로 사용하는 방법을 알려드리겠습니다. (윈도우 사용하는 분들에게는 죄송합니다 ㅠㅠ)

제가 모두 실행한 내용이기 때문에 애플실리콘을 탑재한 맥 사용자 분들은 누구나 설치에 성공하실 수 있습니다. 

 

 

1. Homebrew 우선 설치하기

Homebrew는 macOS용 패키지 관리자입니다. 터미널(Terminal)에서 명령어를 사용하여 자신이 필요한 프로그램을 설치, 삭제, 업데이트를 손쉽게 관리할 수 있습니다.

 

맥환경에서 스테이블 디퓨젼을 설치하기 위해서 우선 Homebrew 를 설치하겠습니다. 

 

1.1. Homebrew 홈페이지

홈브루 홈페이지: 표시된 부분의 코드를 복사하여 터미널에서 실행

 

1.2. 터미널에서 홈브루 설치하기

홈브루 홈페이지에서 아래의 설치 명령어를 복사하여 터미널에서 실행한다. 

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

 

실행하면 아래와 같이 설치가 진행된다. 

설치시 Password 를 물으면 맥 로그인 암호를 입력하고, 계속 진행하려면 Enter 를 친다. 

홈브루 설치 명령 실행 결과

 

2. AUTOMATIC1111 stable-diffusion-webui 설치하기

2.1. AUTOMATiC1111 github 사이트로 가기

GitHub AUTOMATIC1111 사이트

2.2. 맥실리콘에 설치하기로 가기

Installation on Apple Silicon

 

2.3. 설치된 Homebrew를 이용하여, 아래의 명령을 터미널에서 실행한다. 

2.4. AUTOMATIC Web UI repository 의 클론을 설치할 폴더를 생성하고, 터미널에서 새로 생성한 폴더에서 아래 명령을 실행한다. 

 

2.5. Stable Diffusion Model  다운로드 받기

Stable Diffusion 의 모델은 체크포인트(checkpoint)라고도 불리는데 .ckpt 확장자를 갖고있고 이 사이트에서 다운로드할 수 있으나, 이 파일의 경우 악성코드가 포함되어 있을 수 있다고 합니다. 이 경우 같은 모델이지만 .safetensors 확장자를 갖는 경우에는 안전하다고 하니 Hugging Face 사이트에서 모델을 다운 받기로 하겠습니다. 

 

3. Hugging Face 사이트에서 모델 다운받기

허깅페이스 (Hugging Face) 사이트

 

3.1. Hugging Face 사이트에서 stable-diffusion-v1-5 모델 다운로드하기

Hugging Face 사이트의 runwayml/stable-diffusion-v1-5 다운로드 페이지

 

위 사이트에서 v1-5-pruned-emaonly.safetensors 파일 (4.27GB) 을 다운로드 합니다. 

3.2. 다운로드 파일을 아래의 폴더로 저장

설치 폴더 위치: Stable Diffusion git repository 클론 설치 폴더/stable-diffusion-webui/models/Stable-diffuion

 

4. Stable Diffusion 실행하기

터미널에서 Stable Diffusion git repository 클론 설치 폴더로 이동해서 아래 명령어를 실행하면 Stable Diffusion 실행되면서 웹사이트가 생성된다. 

 

 

5. Stable Diffusion 실행 화면

Stable Diffusion 실행 화면

 

http://127.0.0.1:7860/ 에서 웹창이 열리면 실행 성공입니다^^

 

설치된 Stable Diffusion 을 사용하면 이미지를 생성하는 방법은 다음 포스트에서 자세하게 설명하겠습니다. 


용어해설

Stable Diffusion 은 무엇입니까?

Stable Diffusion은 Stability AI가 개발한 오픈 소스 AI 시스템입니다. 이 시스템은 이미지를 생성하거나 기존 이미지를 편집하도록 설계되었으며, 수백만 개의 이미지-텍스트 쌍에 의해 훈련된 딥러닝 모델을 사용합니다. 텍스트 프롬프트가 주어지면 Stable Diffusion은 그 설명에 맞는 이미지를 생성합니다.

Stable Diffusion XL 모델은 이미지 생성 능력에서 중요한 발전을 이루었으며, 향상된 이미지 구성 및 얼굴 생성을 제공합니다. 이 모델은 더 짧은 프롬프트로 설명적인 이미지를 생성하고 이미지 내에 단어를 생성할 수 있습니다. 또한 이미지 내부를 편집하는 인페인팅, 이미지 외부로 이미지를 확장하는 아웃페인팅, 소스 이미지를 사용하여 새 이미지를 프롬프트하는 image-to-image 등 여러 가지 방법으로 이미지를 수정할 수 있습니다. 이전 버전의 Stable Diffusion에 비해 SDXL은 세 배 더 큰 UNet 백본을 활용합니다. 

Stable Diffusion Online을 통해 생성된 이미지는 완전히 오픈 소스로, 명확하게 CC0 1.0 Universal Public Domain Dedication에 속합니다. 이는 이 모델로 생성된 이미지를 저작권 제한 없이 자유롭게 사용할 수 있다는 것을 의미합니다.

 

CC0 1.0 Universal Public Domain Dedication 은 무엇입니까?

CC0 1.0 Universal Public Domain Dedication은 저작권 보유자가 저작물에 대해 가지고 있는 모든 권리를 포기하고 저작물을 공개 도메인에 게시하는 것에 대한  법률 용어입니다.
공개 도메인이란 누구나 저작물을 자유롭게 사용할 수 있음을 의미합니다. 저작물을 복사, 수정, 배포, 상업화하는 데 제한이 없습니다.
CC0 1.0 Universal Public Domain Dedication은 저작권 보유자가 다음과 같은 이유로 사용할 수 있습니다.
  • 저작물을 더 널리 배포하고 사용되기를 원할 때.
  • 저작물을 기반으로 다른 사람들이 새로운 작품을 만들기를 원할 때.
  • 저작권 관리의 부담을 줄이기를 원할 때.
CC0 1.0 Universal Public Domain Dedication은 다음과 같은 조건이 적용됩니다.
  • 저작물을 공개 도메인에 놓기 위한 의사는 명확해야 합니다.
  • 저작권 보유자는 저작물에 대한 모든 권리를 포기해야 합니다.
  • 저작권 보유자는 저작물을 공개 도메인에 놓는 것에 대한 보상을 요구할 수 없습니다.
CC0 1.0 Universal Public Domain Dedication은 저작물을 공개 도메인에 놓는 가장 간편한 방법 중 하나입니다. 이는 사용하기 쉽고 무료이며 저작권 문제에 대한 우려 없이 저작물을 사용할 수 있도록 합니다.
하지만 다음과 같은 사항에 유의해야 합니다.
  • CC0 1.0 Universal Public Domain Dedication을 사용하면 저작물에 대한 모든 권리를 포기하게 됩니다. 이는 영원히 되돌릴 수 없습니다.
  • CC0 1.0 Universal Public Domain Dedication은 저작권이 아닌 다른 권리, 예를 들어 상표권이나 개인 정보에 대한 권리에는 적용되지 않습니다.

 

AUTOMATIC1111 Web UI 는 무엇입니까?

Automatic1111은 2022년에 출시된 딥 러닝 기반의 텍스트-이미지 모델입니다. 텍스트 설명에 따라 상세한 이미지를 생성하는 데 주로 사용되지만, 인페인팅, 아웃페인팅, 이미지 생성과 같은 다른 작업에도 적용할 수 있습니다.
Automatic1111 Web UI는 다음과 같은 기술을 사용하여 작동합니다.
  • 텍스트-이미지 모델: 텍스트 설명을 입력받아 이미지를 생성하는 인공 지능 모델입니다. Automatic1111 Web UI는 Google AI의 PaLM2 모델을 사용합니다.
  • WebAssembly: JavaScript와 호환되는 실행 가능한 바이너리 형식입니다. Automatic1111 Web UI는 PaLM2 모델을 WebAssembly로 컴파일하여 웹 브라우저에서 실행합니다.
  • TensorFlow.js: JavaScript로 TensorFlow를 구현한 라이브러리입니다. Automatic1111 Web UI는 TensorFlow.js를 사용하여 PaLM2 모델을 제어합니다.
Automatic1111 Web UI의 전체적인 작동 과정은 다음과 같습니다.
  1. 사용자는 웹사이트에 접속하여 텍스트 설명을 입력합니다.
  2. 텍스트 설명은 JavaScript로 변환됩니다.
  3. 변환된 텍스트 설명은 WebAssembly로 컴파일된 PaLM2 모델에 입력됩니다.
  4. PaLM2 모델은 텍스트 설명을 기반으로 이미지를 생성합니다.
  5. 생성된 이미지는 JavaScript로 변환됩니다.
  6. 변환된 이미지는 웹 브라우저에 표시됩니다.