
일반 질의응답과 고난이도 추론을 하나의 엔진으로 통합해
코난테크놀로지가 자체 개발한 차세대 LLM(대규모 언어모델) ‘ENT-11’을 이달 말 공식 출시한다. 이번 모델은 일반 질의응답과 고난이도 추론을 하나의 엔진으로 통합해 GPU 비용을 줄이면서도 고성능을 유지할 수 있는 것이 가장 큰 특징이다.
코난테크놀로지는 이번 ENT-11 모델에 일반 모드와 추론 모드를 단일 모델로 통합하는 구조를 도입했다. 기존에는 각각 다른 모델을 운영해야 했던 방식과 달리, 하나의 엔진으로 모든 작업을 처리할 수 있어 운영 효율성과 비용 절감이라는 두 마리 토끼를 동시에 잡았다. 특히 복잡한 멀티턴 대화와 논리적 추론이 요구되는 환경에서도 최적의 응답을 제공할 수 있도록 설계됐다.
ENT-11은 학습 단계에서 한국어 토큰 비중을 높게 설정한 것이 특징이다. 이로 인해 Qwen, LLaMA, Gemma, DeepSeek 등 글로벌 모델에 비해 한국어 기반 질의에서 처리 정확도와 응답 속도 모두에서 우위를 보인다.
코난테크놀로지는 자체 번역과 검수 과정을 거쳐 정교하게 구축한 ‘Konan MT-Bench’를 통해 ENT-11의 성능을 측정했다. 평가 결과 ENT-11은 동급 모델인 딥시크 R1 대비 평균 5.38%포인트 높은 성능을 기록했다. 특히 복잡한 추론, 수학, 코딩 분야에서 두각을 나타냈으며, 매개변수 규모는 딥시크의 20분의 1 수준(32B)에 불과하다.
또한, 동일 매개변수 조건에서의 비교 평가에서는 ENT-11이 딥시크 R1보다 평균 4.75%포인트 높은 성능을 기록해 컴팩트 모델 설계의 효율성과 정밀성을 입증했다. ENT-10 대비 일반 모드 성능도 약 4.5%포인트 향상됐다.
모델 성능 향상은 컨텍스트 길이에서도 확인된다. ENT-11은 최대 128K 토큰을 지원해 기존 ENT-10의 16K 대비 8배 이상 향상됐다. 이는 A4 용지 기준 한글 약 128장, 영어 320장 분량에 해당하는 정보량을 한 번에 처리할 수 있는 수준으로, 실시간 문서 요약 및 대화형 보고서 작성 등 다양한 비즈니스 활용 가능성을 높인다.
김영섬 대표는 “LLM 시장이 고도화되면서 특정 평가 항목만 잘 수행하는 모델이 주목받는 경우가 있는데, 다양한 분야에 고르게 대응하는 범용성과 효율성이 중요하다”고 강조했다. 이어 “딥시크 대비 20배나 작은 모델이 더 높은 추론 성능을 보였다는 점에서 ENT-11은 효율성과 정밀성이라는 두 개의 핵심 가치에 집중한 결과”라고 밝혔다.
코난테크놀로지는 향후 ENT-11을 기반으로 AI 에이전트, 문서 분석, 산업용 Q&A 시스템 등 다양한 분야에서 활용을 확대할 방침이다.
헬로티 서재창 기자 |