
국내 최초로 한국어로 추론 전 과정을 출력하는 모델로 평가받아
디노티시아가 한국어 논리 추론에 최적화한 대형언어모델(LLM) ‘DNA-R1’을 공개했다.
DNA-R1은 한국어 특화 모델로, 140억(14B)개의 파라미터를 갖췄으며, 국내에서는 최초로 한국어로 추론 전 과정을 출력하는 모델이다. 특히, 한국어 AI 성능 평가 지표인 KMMLU(Measuring Massive Multitask Language Understanding in Korean) 벤치마크에서 59.9%를 기록하며, 기존 동급 모델(50.50%) 대비 약 18.6% 성능 향상을 입증했다.
디노티시아는 지난해 한국어·영어를 동시에 이해하는 고성능 LLM 파운데이션 모델 ‘DNA : Dnotitia AI’를 오픈소스로 공개한 바 있다. 이번 DNA-R1은 논리적 추론과 문제 해결 능력을 한층 강화한 모델로, 단순한 텍스트 생성에서 벗어나 고도화한 분석과 복합적 사고까지 수행할 수 있도록 설계됐다. 기존 AI 모델이 문장 생성과 번역에 초점을 맞췄던 것과 달리, DNA-R1은 수학문제 해결, 코드 작성 및 디버깅, 논리적 사고 및 분석, 한국어 문맥 이해 등 고차원적인 작업을 수행하는 것이 특징이다.
디노티시아는 AI 모델의 논리적 사고 능력을 극대화하기 위해 세 단계의 학습 프로세스를 적용했다. 먼저, 대량의 한국어 데이터를 학습해 문장 이해 능력을 확보했으며, 이후 논리적 사고에 특화한 데이터를 추가 학습시켜 문제 해결 능력을 향상시켰다. 마지막으로, AI가 스스로 정답을 도출하도록 보상 학습 기법을 적용, 한국어·영어로 정확하고 일관된 응답을 생성하도록 강화 학습을 진행했다.
디노티시아 SLM 박상길 팀장은 “DNA-R1 모델을 활용하면 한국어로 제시된 복잡한 문제도 쉽고 명확하게 풀이할 수 있다”며, “앞으로도 우수한 AI 모델을 지속적으로 선보이며 오픈소스 생태계의 확장을 적극 지원하겠다”고 덧붙였다.
디노티시아 정무경 대표는 “지난 12월 ChatGPT ‘O1’ 출시 이후, AI 서비스 패러다임이 단순한 응답 생성에서 논리적 사고에 기반한 추론으로 급격히 전환되고 있다”며, “디노티시아는 이러한 변화에 발맞춰, ‘O1’ 공개 이후 빠르게 한국어에 최적화한 추론 모델을 선보이며, 글로벌 AI 기업과의 기술 격차를 좁혀가고 있다“고 말했다.
디노티시아는 DNA-R1을 글로벌 AI 플랫폼 허깅페이스를 통해 오픈소스로 공개했다. 이는 지난해 공개한 DNA: Dnotitia AI 파운데이션 모델에 이어, 한국어 AI 연구를 위한 기술 공유를 확대하는 전략적 행보다. 이번 공개를 통해 AI 연구자 및 개발자는 논리적 추론이 가능한 한국어 AI 모델을 활용할 수 있으며, 이를 기반으로 다양한 응용 연구와 기술 발전을 도모할 것으로 기대된다.
헬로티 서재창 기자 |