자료 조사

DALL-E 2 사용기

pnltoen 2022. 10. 2.
반응형

DALL-E 2

OpenAI


요즘 부쩍 페이스북 그리고 주변 사람들이 텍스트를 입력받고 이미지를 생성하는 OpenAI의 Dall-E 2에 대해서 이야기를 많이 해보길래 써보았다. (정리 글 아님)

 

 

사용방법

 

DALL-E 2를 사용하기 위해서는 신청기간이 별도로 필요하다. 우선 홈페이지에 접속한 후 Sign UP을 누른다. 이 후에 Waitlist에 추가할 수 있는데 추가하면 다음과 같이 이메일을 받을 수 있다.

 

바로 써보고 싶었는데 못써봐서 아쉽...

 

이 후에 시간이 지나면 다시 이메일이 오는데 "Your invite to create with DALL·E is here" 라는 메일로 받았다. 1일 정도 기다리면 된다는 이야기가 많았는데 그새 사람이 많아진건지... 나의 경우에는 4일정도 걸렸다. 

 

 

사용하기전에 유튜브에서 몇몇 영상을 보면서 관련해서 공부해 보았다. 관련해서 본 영상을 준비했으니 기다리는 동안이나 사용하기 전에 보면 DALL-E의 개념 그리고 사용법에 대한 팁을 얻을 수 있다.

 

 

실습(?) 결과

 

흠... 잘 안되는데여?

 

처음에 실습을 시작할 때는 추후에 블로그 썸네일을 만들 때 사용할 수 있지 않을까? 하고 Unity 그리고 Omniverse 관련 기술 적인 내용으로 이미지 생성을 하려고 했다. 근데 Unity도 단어자체에 뜻이 있고, Omniverse고 뜻이 있어서 그런지... 이미지 생성이 잘 되지 않는 것 같았다. 아니면 캡션 데이터가 부족하거나 중간 중간 Policy 문제라고 나오던데 마이크로소프트 관련된 내용도 안나오는걸 보니 정책으로 막아놨거나 그것도 아니면 노마드코더가 말한 것 처럼 그냥 아직 글자를 렌더링하는 부분은 DALL-E가 개선이 필요하거나... 

 

아무튼 "Nvidia Omniverse 3D Render"로 이미지를 생성했는데 다음과 같은 결과가 나왔다.

 

 

물론 "Unity", "Unity Technologies", "Unity Digital Twins" 다 해봤는데.... 유니티는 더 흔한 단어여서 그런가 아예 관련 없는 내용만 생성이 되었다. 시작부터 잘 안되길래 그 이후로는 천천히 단어를 추가하면서 진행해보았다.

 

Ponytail

 

예전부터 긴 머리를 묶는 여자 뒷모습 사진을 핸드폰 배경으로 하는 것을 좋아했는데 뭔가 몽환적이기 때문이다 (개취 매우 존중 바람) 아무튼 과연 어떤 결과가 나올까? 궁금했다.

 

ⓒ DALL-E - 석양 아래에서 머리를 묶는 여자의 뒷모습
ⓒ DALL-E - 석양 아래에서 머리를 묶는 여자의 뒷모습, Lowpoly 스타일
ⓒ DALL-E - 석양 아래에서 머리를 묶는 여자의 뒷모습, Digital Arts 스타일
ⓒ DALL-E - 서울 석양 아래에서 머리를 묶는 여자의 뒷모습, Digital Arts 스타일
ⓒ DALL-E - 서울 석양 아래에서 긴 머리를 묶는 여자의 뒷모습, Digital Arts 스타일
ⓒ DALL-E - 아침 서울 달빛 아래에서 긴 머리를 묶는 여자의 뒷모습, Digital Arts 스타일
ⓒ DALL-E - 아침 서울 달빛 아래에서 긴 머리를 묶는 귀여운 여자의 뒷모습, Digital Arts 스타일
ⓒ DALL-E - 아침 서울 달빛 아래에서 긴 머리를 묶는 귀여운 여자의 뒷모습, 실사

 

중간 중간 이러한 단어를 넣으면 어떠한 결과가 나올까.... 해서 이것저것 해봤다. "귀여운" 이라는 단어도 넣어보고 "아침의 달빛 아래" 이런 키워드도 "Lowpoly, Photo Realistic, Digital Arts"등 이것저것 해봤는데... 확실히 이미지 생성은 정말 잘해주는 것 같다. 특히 DALL-E 홈페이지를 들어가보면 다양한 예쁜 사진들이 있는데... 정말 대박이다. 모두 한번 쯤 해보시길...

 

 

+) 저작권은 Open AI한테 있다고 합니다. 비상업적 사용은 가능한 것 같습니다. 직접 사용해보려고 하시는 분들은 명확하게 확인하셔야 할 것 같습니다. 

저작권 관련해서도 이 이미지를 만드는데 쓰인 이미지 데이터 제작자, Open AI, 타이핑 하고 생성한 사람 이 세 사람들이 어떻게 나누어서 가져야 하냐? 하는 논쟁이 있는 것 같네요.

반응형

댓글