텍스트·이미지 동시 이해 및 정보를 종합적으로 추론하는 멀티모달 기능 보유
네이버가 고도화한 추론형 멀티모달 인공지능(AI) 모델 ‘하이퍼클로바X 씽크(HyperCLOVA X Think)’를 공개하며, 초거대 AI 기술 경쟁에 다시 한 번 시동을 걸었다. 이 모델은 언어뿐 아니라 시각 정보를 기반으로 사고하고 추론할 수 있는 능력을 갖춘 차세대 생성형 AI로, 국내외 주요 벤치마크에서 뛰어난 성과를 거두며 기술력을 입증했다.
네이버는 6월 30일 하이퍼클로바X 씽크의 개발을 완료하고, 모델 설계 및 성능에 대한 세부 내용을 담은 테크니컬 리포트를 발표했다. 특히 한국어 자연어처리(NLP) 벤치마크인 ‘KoBALT-700’ 기준으로 측정한 결과, 동일 규모의 국내외 추론 모델과 오픈소스 LLM을 모두 상회하는 성능을 보였다고 밝혔다.
이번에 공개된 모델은 단순한 언어 처리 능력에 머무르지 않는다. 텍스트와 이미지를 동시에 이해하고, 주어진 정보를 종합적으로 추론하는 멀티모달 기능을 갖췄다. 실제로 과학·기술·공학·수학(STEM) 유형의 문제를 이미지 형태로 입력하자, 이를 인식해 분석한 뒤 정답을 도출하는 과정을 성공적으로 수행한 사례도 소개됐다.
네이버는 해당 모델을 조만간 오픈소스로 공개할 계획이다. 앞서 4월 공개된 경량 AI 모델 ‘하이퍼클로바X 시드(Seed)’는 누적 다운로드 수 50만 회를 돌파하며 업계의 주목을 받은 바 있다. 이번 모델 역시 생태계 확장에 기여할 것으로 기대된다.
네이버클라우드 성낙호 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X는 지능 향상과 감각 확장을 동시에 추구하며 발전하고 있다”며 “기술 중심의 접근을 넘어, 실제 사용자의 문제를 해결하는 실용적 AI로 자리매김할 것”이라고 밝혔다. 네이버는 하이퍼클로바X 씽크를 통해 차세대 AI 모델 주도권 확보는 물론, 기업과 개발자들이 다양한 산업 현장에서 활용 가능한 ‘국산 AI의 레퍼런스’를 구축해 나간다는 전략이다.
헬로티 서재창 기자 |