배너
닫기

일반뉴스

배너

업스테이지, KT·콴다와 수학능력 언어모델 세계기록 세워

URL복사
[무료 등록] 최신 AI MCU 개발 트렌드와 함께 실제 산업 현장에서의 응용 방법을 소개합니다 (5/14, 코트야드 판교호텔 8층)

 

언어 모델 수학 능력을 평가하는 대표 벤치마크 테스트에서 MS ‘ToRA 13B’ 능가

 

업스테이지가 8일 AI 기반 학습 플랫폼 ‘콴다’를 운영하는 매스프레소(이하 콴다), KT와 공동 개발한 수학 도메인 특화 ‘MathGPT(가칭)’가 오픈AI의 챗GPT와 마이크로소프트(MS) 모델을 제치고 세계 신기록을 달성했다고 밝혔다. 

 

작년 11월, 업스테이지와 콴다는 KT와 전략적 파트너십의 일환으로 MathGPT 개발에 착수했다. 업스테이지는 콴다의 고품질 수학 전문 데이터를 학습해 자연어 기반 언어 모델이 논리적 추론과 프로그래밍화를 통해 복잡한 수학 문제를 풀도록 파인튜닝을 진행했다. 

 

이에 양사는 13B 매개변수의 MathGPT를 개발, ‘MATH’, ‘GSM8K’ 등 언어 모델의 수학 능력을 평가하는 대표 벤치마크 테스트에서 동급 최강의 MS ‘ToRA 13B’를 능가하는 고무적인 성적표를 거뒀다. 이는 13B 이하 모델 1위에 해당하는 신기록이다. 

 

1만2500개의 고난도 수학 경시 문제로 구성된 MATH 벤치마크와 8500개의 초등학교 수학 문제로 산술 연산을 테스트하는 GSM8K 벤치마크 등 두 가지 척도에서 동시에 최고 성능을 달성한 경우는 최근 세계적으로도 유례를 찾아볼 수 없는 성과다. 

 

특히, MathGPT는 벤치마크 테스트 평균에서 챗GPT 성능을 돌파하고, MATH 벤치마크에서는 GPT-4까지 능가하기도 했다. 업스테이지는 수학 도메인에서 국내 개발한 소형 사이즈 모델이 오픈AI, MS 등 빅테크 기업을 제치고 의미 있는 깃발을 꽂은 것이라고 소감을 밝혔다. 

 

이러한 성과에는 업스테이지, 콴다, KT 3사의 유기적인 협력이 주효했다. 전략적 파트너십을 통한 KT의 전폭적인 인프라 지원에 힘입어, 콴다의 독보적인 수학 특화 노하우와 고품질 학습 데이터, 그리고 자체 언어 모델 ‘솔라(SOLAR)’로 업스테이지의 모델링 기술력이 합쳐져 만들어낸 결과물로 해석된다. 

 

MathGPT를 통해 교육 영역에서도 가시적인 성과를 확인한 업스테이지는 앞으로 솔라를 앞세워 LLM 시장 재편에 나선다. 금융, 유통, 의료, 엔터테인먼트 등 다양한 산업군을 망라해 국내를 넘어 본격적인 해외 진출을 위한 발판으로 글로벌 체질 강화에도 주력할 방침이다. 

 

업스테이지 김성훈 대표는 “콴다, KT와의 협력을 통해 챗GPT를 뛰어넘고 세계 최고 수준의 수학 특화 언어 모델을 개발하게 돼 뜻깊다”며 “앞으로 업스테이지는 글로벌 1위 LLM 기술력을 바탕으로 다양한 영역에서 생성형 AI 혁신을 주도할 것”이라고 밝혔다. 

 

콴다 이용재 대표는 “콴다, 업스테이지, KT 3사의 기술력과 노하우가 합쳐져 글로벌 빅테크를 뛰어넘은 의미 있는 결과를 만들어냈다”며, “콴다의 AI 튜터로 아시아를 넘어 전 세계 학생의 교육 경험을 혁신할 것”이라고 밝혔다.

 

헬로티 서재창 기자 |










배너









주요파트너/추천기업