프롬프트 엔지니어링을 이용한 멀티모달 이미지 편집 렌더링 성능 개선

작성자 이민수
학과 또는 소속(회사명) 컴퓨터공학과
조회수 3
평가(좋아요)수 0
댓글수 0
FaceDNeRF는 사람 얼굴을 생성하는 데 특화된 희소 3D 렌더링 모델로, 단 하나의 사진과 텍스트 프롬프트로 이미지를 편집하여 다양한 각도로 변환된 여러 2D 사진을 생성함으로써 3D 객체를 만듭니다.

하지만 특정 프롬프트, 예를 들어 지나치게 일반적인 단어가 입력될 경우, FaceDNeRF는 입력 텍스트에 따라 이미지를 제대로 편집하지 못할 수 있습니다.

FaceDNeRF 모델에 입력된 프롬프트에서 일반화된 단어를 구체적으로 지정하는 프롬프트 엔지니어링 기법을 적용함으로써, 올바르게 편집된 이미지를 생성할 수 있음을 보여줍니다.

프롬프트를 “a lady with a pair of glasses”에서 “a lady with a pair of horn-rimmed glasses”로 바꿈으로써 왼쪽에서 오른쪽으로 생성되지 않는 결과가 제대로 생성된 것을 볼 수 있습니다.

Github

프롬프트 엔지니어링을 이용한 멀티모달 이미지 편집 렌더링 성능 개선

조회수 3
평가(좋아요)수 0
댓글수 0
게시 : 2024년 11월 07일
이민수 컴퓨터공학과

프롬프트 엔지니어링을 이용한 멀티모달 이미지 편집 렌더링 성능 개선

조회수 3
평가(좋아요)수 0
댓글수 0
게시 : 2024-11-07

Member

이민수

Keyword

  • 인공지능