테크노트 KAIST·네이버, AI 생성 모델 창의성 높이는 기술 개발
한국과학기술원(KAIST) 최재식 교수는 네이버 AI Lab과 공동 연구를 통해 추가적인 학습 없이도 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다고 19일 밝혔다. 텍스트를 기반으로 이미지를 생성하는 AI 모델인 ‘스테이블 디퓨전’은 자연어로 제공된 설명만으로도 고해상도·고품질 이미지를 자동 생성할 수 있다. 학습된 모델과 소스코드가 공개돼 있어 상업적·연구 목적으로 활발히 활용되고 있다. 하지만 ‘창의적인’ 이라는 텍스트를 입력해도 독창적인 이미지를 만들기 어려워 추가적인 데이터를 필요로 한다. 연구팀은 AI 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 특징 맵을 주파수 영역으로 변환한 후 높은 주파수 영역에 해당하는 부분의 값을 증폭하면 노이즈나 작게 조각난 색깔 패턴의 형태를 유발하는 것을 확인했다. 낮은 주파수 영역을 증폭함으로써 별도의 학습 없이도 효과적으로 창의적 생성을 강화할 수 있다. 유용성까지 고려해 AI 모델 내부의 블록별로 최적의 증폭 값을 자동으로 선택하는 알고리즘을 제시했다. 개발한 알고리즘을 사용하면 기존 모델 대비 참신하면서도 유용성이 크게 저하되지 않은 이미지를 생성할 수 있다고