
같은 AI 기술을 기반으로 개발됐더라도, 사용자 경험은 전혀 다르다.
어떤 챗봇은 감정을 이해하며 대화를 이어가는 반면, 어떤 챗봇은 질문 의도를 제대로 파악하지 못한다. 이 같은 차이를 만들어내는 핵심 요인은 무엇일까? 산업 전문가들은 입을 모아 "결국 성능을 좌우하는 건 학습데이터의 질"이라고 말한다.
AI가 세상을 이해하는 방식은 인간이 설계한 데이터로부터 출발한다. 최근 AI 업계는 단순히 많은 데이터를 확보하는 것에서 벗어나, 현실성과 정밀도가 높은 데이터 설계에 집중하고 있다. 특히 감정, 언어, 문화, 맥락 등 사람 중심의 복합 요소를 반영한 데이터가 AI 성능 향상에 핵심 역할을 한다는 인식이 확산되고 있다.
이런 흐름 속에서 판티마는 텍스트, 음성, 이미지 등 멀티모달 학습 데이터를 실제 사용 환경에 맞춰 설계하고, 고객 맞춤형으로 수집·가공·납품하는 전 과정을 직접 수행하고 있다. 최근에는 글로벌 게임사와 협력해 혐오 발언 및 감정 인식이 가능한 AI 모델 개발을 위한 다국어 음성 데이터셋을 구축 중이다. 이는 AI가 실제 환경에서 악성 행위를 얼마나 정확히 인지하고 대응할 수 있는지를 좌우하는 기반 기술이다.
판티마의 데이터 전략은 ‘1사 1데이터’ 원칙에 뿌리를 두고 있다. 동일한 데이터를 여러 고객에 판매하지 않으며, 납품 후에는 서버에서 해당 데이터를 즉시 삭제한다. 고객은 독점적이고 저작권이 확보된 고품질 데이터를 통해 AI 모델을 학습시키며, 이는 곧 성능 차별화로 이어진다. 또한, 프로젝트마다 검증된 참여자만 데이터 수집에 투입되며, 감정과 상황을 정교하게 반영한 데이터 시나리오가 설계돼 AI의 문맥 이해도를 끌어올린다.
판티마는 현재 글로벌 시장 확대를 위한 전략적 투자 유치도 검토 중이다. AI 성능이 알고리즘의 우위보다 데이터의 정밀도에 의해 좌우되는 시대, 데이터 설계부터 저작권·윤리 기준까지 갖춘 판티마의 접근 방식은 산업 내에서 새로운 표준으로 주목받고 있다. 전신우 판티마 대표는 “AI가 현실을 더 잘 이해하려면, 그 학습 데이터가 현실을 정밀하게 반영해야 한다”며 “정확하게 설계된 데이터가 AI 경쟁력의 핵심”이라고 강조했다.
헬로티 서재창 기자 |