Search

정말 간단한! 텍스트 반전(Textual Inversion) 살펴보기

정말 간단한! 텍스트 반전(Textual Inversion) 살펴보기
Textual Inversion 배경
Stability AI가 스테이블 디퓨젼 v2 및 v2.1 버전을 출시했을 때, 새 버전으로 생성된 이미지의 품질이 이전 v1.5 모델에서 생성된 이미지보다 눈에 띄게 나빠졌다는 이유로 많은 비판과 반발을 받았습니다.
하지만, 스테이블 디퓨젼 2.1에서는 Textual Inversion(TI)이라는 새로운 기술이 이전 모델보다 훨씬 잘 작동합니다. Textual Inversion은 스테이블 디퓨젼 내부에 이미 존재하는 개념의 표현을 찾아서 스테이블 디퓨젼에 새로운 개념을 가르치는 방법입니다.
작동 방식은 다음과 같습니다. 생성하려는 새로운 개념의 이미지(예: 얼굴, 사물, 스타일 등)를 입력하면 스테이블 디퓨젼에서 새로운 개념을 표현하는 데 사용할 수 있는 기존의 유사한 개념을 찾아서 가르칩니다.
그런 다음 스테이블 디퓨젼에서 특정 방식으로 결합하여 입력한 이미지에 표현된 개념과 유사한 것을 얻을 수 있는 기존 개념 집합을 제시합니다.
Textual Inversion에서는 새로운 개념을 표현하기 위해 이미 스테이블 디퓨젼에 있는 것을 결합하는 방법만 찾으면 되지만, 드림부스에서는 모델이 해당 개념을 학습하기 위해 전체 모델을 다시 훈련하고 완전히 새로운 .ckpt 파일을 만들어야 하기 때문에 드림부스와는 완전히 다릅니다.
Textual Inversion 장점
파일 크기 (킬로바이트 단위의 작은 파일을 관리하기 때문에 작업이 훨씬 수월해집니다.)
동일한 프롬프트에 여러 임베딩(모델)을 결합할 수 있음
Textual Inversion 단점
임베딩 당 하나의 개념만 학습할 수 있음
현재 사람이나 구체적인 아트 스타일에 TI를 사용하는 방법에 대한 문서는 거의 존재하지 않음
Textual Inversion 사용법
1.
사용하려는 파일을 다운로드합니다.
2.
스테이블 디퓨젼 폴더로 이동하여 embeddings 폴더 안에 TI 파일을 넣습니다.
3.
프롬프트 내에서 TI에 표시된 개념을 사용하려면 프롬프트에 파일 이름에서 확장자를 빼고 입력하면 됩니다(방금 다운로드한 파일 이름이 SCG768-Euphoria.pt인 경우 프롬프트에 SCG768-Euphoria를 입력하여 사용하세요). 이를 "임베딩 호출"이라고 하며, 임베딩을 호출하는 데 사용하는 단어를 "트리거 단어"라고 합니다.
임베딩이 프롬프트에 미치는 영향을 줄이려면 다음과 같이 트리거 단어 뒤에 :0.5 또는 0과 1 사이의 다른 숫자를 추가하면 됩니다!
<<< 이전 글 보러가기