다양한 문제 풀이 궤적과 의도 사례 (출처 : GIST) (왼쪽부터)GIST AI융합학부 김선동 교수, 김세진 박사후연구원, 황산하 석사과정 졸업생, 이승필 석사과정생, 전기전자컴퓨터공학과 이호성 학사 졸업생 (출처 : GIST) 광주과학기술원(GIST) 김선동 교수 연구팀이 사람의 문제 풀이 과정 속 ‘의도’를 추정·정렬하는 학습 알고리즘과 생성모델을 결합해 사람처럼 다양한 풀이 과정을 만들어내는 데이터 증강 기법을 제안했다. 연구팀은 이를 통해 단순 정답 산출을 넘어 인간과 유사한 추론 능력을 갖춘 인공지능을 구현했다고 25일 밝혔다. 기존 인공지능은 주어진 문제의 정답 도출에는 강점을 보였지만, 인간처럼 단계적 사고 과정을 거치는 추론 능력은 부족했다. 연구팀은 인간이 문제 해결 과정에서 겪는 시행착오와 다양한 풀이 전략에 주목했다. 특히 풀이 과정에는 단순한 행동의 나열이 아닌 목표와 전략, 즉 ‘의도’가 담겨 있다는 점에서 착안했다. 연구팀은 문제 풀이 과정을 세분화해 각 단계의 의도를 추정하고 이를 정렬하는 알고리즘을 개발했다. 이어 생성모델 중 하나인 지플로우넷(GFlowNet)을 활용해 다양한 풀이 경로를 생성하는 데이터 증강 기법을 적용했다.
양사 협력으로 수학 문제 해결과 코드 생성에 특화한 경량 모델 개발 SK텔레콤과 크래프톤이 공동으로 개발한 70억 파라미터(7B) 규모의 추론 특화 언어 모델 3종을 공개하며, 도메인 특화형 AI 모델 개발 역량을 입증했다. 이번에 공개된 모델은 각각 OpenThinker2, OpenThinker3, AceReason-Nemotron-1.1으로, 수학 문제 해결과 코드 생성에 특화한 경량 모델이라는 점에서 주목된다. 모델 학습에는 크래프톤이 자체 개발한 오답 복기 학습 기법이 적용됐다. 이 방식은 모델이 틀린 문제를 중심으로 학습하면서 정답과 오답을 비교·분석해 추론 정확도를 높이는 전략이다. 이를 통해 수학 추론 성능 벤치마크인 AIME 25에서 기존 대비 뚜렷한 성능 개선을 이뤘다. AIME는 미국 수학 경시대회 상위권 학생만 응시 가능한 시험으로, 언어 모델의 논리적 추론 역량을 평가하는 데 활용된다. SK텔레콤은 모델 학습에 필요한 데이터 검증과 인프라 구축을 담당해 품질 안정성과 성능 고도화에 기여했다. 두 기업은 모델 공동 개발을 통해 생성형 AI 기술의 도메인 특화 가능성을 실증했으며, 이를 기반으로 향후 다양한 산업군에 AI 기술을 확장할 수
누구나 내려받아 학습하고 수정해 연구와 비즈니스에 적용할 수 있어 네이버가 자체 개발한 생성형 AI ‘하이퍼클로바X(HyperCLOVA X)’의 경량 모델을 상업적 용도로도 활용 가능한 오픈소스로 24일 공개한다. 국내 주요 기업 가운데 생성형 AI 모델을 상업 이용 목적으로 무료 공개하는 것은 이번이 처음이다. 네이버클라우드는 이번에 HyperCLOVA X SEED 3B, SEED 1.5B, SEED 0.5B 등 총 3종의 경량 모델을 오픈소스 형태로 배포한다. 누구나 내려받아 학습하고 수정해 연구와 비즈니스에 적용할 수 있다. 특히 기존에는 연구 용도로만 제한된 사례가 많았던 반면, 이번 공개 모델은 상업적 라이선스까지 지원돼 비용 부담으로 AI 도입을 망설였던 중소기업과 스타트업에 실질적인 기회를 제공할 전망이다. 공개된 모델 중 ‘SEED 3B’는 텍스트뿐 아니라 이미지와 영상까지 이해할 수 있는 시각언어모델로, 도표 해석, 사진 설명, 개체 인식 등 복합적인 작업 수행이 가능하다. 특히 한국어와 한국 문화 관련 시각 정보를 이해하는 벤치마크 9개에서 동급 미국, 중국 모델보다 높은 성능을 기록했고, 일부 대규모 외산 모델과도 유사한 결과를 보였다.