업스테이지-NIA, Open Ko-LLM 리더보드 개편 나섰다

URL복사

7월 말 기준 1700개가 넘는 LLM 모델이 제출되는 등 많은 참여 이어져

업스테이지와 한국지능정보사회진흥원(이하 NIA)이 공동 운영하는 ‘Open Ko-LLM 리더보드’가 8월 12일부터 새로운 벤치마크를 적용한 시즌 2로 전면 개편된다.

Open Ko-LLM 리더보드는 ’23년 9월 민관협력을 통해 개설된 국내 최대 개방형 한국어 거대언어모델(LLM) 평가 체계로, 산·학·연 각계 분야에서 7월 말 기준 1700개가 넘는 LLM 모델이 제출돼 경쟁하는 등 많은 관심과 참여가 지속되고 있다.

최근 LLM 기술이 빠르게 발전함에 따라, 1년 전에 만들어진 리더보드 벤치마크의 개선 필요성이 대두됐다. 이에 따라 업스테이지와 NIA는 기존 벤치마크를 전면 폐지하고 새로운 성능 평가 지표를 적용한 Open Ko-LLM 리더보드 시즌 2 운영을 시작한다. 새롭게 추가된 벤치마크는 Ko-GPQA(대학원 수준 추론), Ko-WinoGrande, Ko-GSM8K(초등 수학), Ko-EQ-Bench(감성), Ko-IFEval(지시 이행), KorNAT-Knowledge(한국어 신뢰성), KorNAT-Social-Value(사회적 가치), Ko-Harmlessness(무해성), Ko-Helpfulness(실용성) 등 총 9개다.

기존에는 LLM의 근본적인 언어능력 평가에 초점을 맞췄다면, 새 시즌에서는 고도화한 지능과 문제해결 능력 등 실용적인 부분에 집중한다. 이를 위한 지표를 촘촘하게 구성해 고성능 모델의 옥석을 가려낼 것이라는 기대다. 이에 기존 제출됐던 모든 모델을 포함해 향후 제출되는 모든 LLM은 신규 벤치마크를 통해 평가될 예정이다. 또한, 플리토, 셀렉트스타 및 KAIST AI 대학원이 새롭게 참여해 전문화한 벤치마크 데이터셋을 제공할 예정이다.

업스테이지 김성훈 대표는 “새롭게 개편된 리더보드로 한국어 LLM 성능 평가의 기준점을 한 단계 더 높일 것으로 기대한다”며 “앞으로 업스테이지는 글로벌 표준을 뛰어넘는 국내 AI 생태계 강화에 앞장설 것”이라고 밝혔다. NIA 황종성 원장은 “리더보드는 민관 협업을 통해 한국어 LLM 생태계 조성에 기여해 오며 시즌2 개편을 통해 한국어 LLM 기술이 세계적 수준에 한발 더 올라서는 계기가 되기를 기대한다”고 밝혔다.

헬로티 서재창 기자 |

[인더스트리 솔루션 인사이트] AW 2026 주목할 베스트 솔루션 (2편)

제36회 스마트공장·자동화산업전(AW 2026)은 제조 인공지능 전환(AX) 시대를 관통하는 산업·공장 자동화(FA) 및 스마트 팩토리(Smart Factory) 기술의 현재와 미래를 집약적으로 보여주는 아시아 최대 산업자동화 전시회다. 내년 전시 현장에서는 제조 경쟁력을 좌우할 솔루션이 등판했고, 이를 기반으로 한 전시회는 각종 산업의 전략이 교차하는 바로미터 역할을 해왔다. 그동안 AW에서 소개된 수많은 기술과 제품은 국내 제조기업의 체질을 강화하고 글로벌 시장에서 차별화된 경쟁력을 확보하는 토대가 됐다. 이번 특집에서는 내년 3월 열리는 AW 2026에 참가한 기업들 가운데, 제조 AX 시대를 이끌 주목할 만한 제품과 솔루션을 조명한다. [특집] AW 2026 주목할 베스트 솔루션 (2편) [스마트 물류] 공장은 이미 자동화됐다, 문제는 ‘물류의 뇌’ [스마트 제조 SW] 데이터 끊김 없는 공장…“ERP·MES 유기적 결합이 지능형 공장 이끌어” [로보틱스] 중국서 검증된 로봇 하드웨어 파워, 국내 로봇 제조 시장의 ‘메기 효과’ 될까 [스마트 물류] 바퀴 달린 모든 것을 AMR로…업계가 ‘맞춤형 자율주행’에 주목하는 이유 [제조 AI] 제조 AI 성공

애로우, 공기열원 히트펌프로 보는 차세대 HVAC 설계 전략

애로우 일렉트로닉스(이하 애로우)가 공기열원 히트펌프(ASHP)를 탈탄소화와 에너지 효율 향상을 동시에 실현하는 차세대 HVAC 시스템의 핵심 대안으로 제시했다. 애로우는 ASHP를 단순한 냉난방 설비가 아닌 규제 대응, 지속가능성 전략, 시장 차별화를 함께 충족하는 확장 가능한 플랫폼으로 정의하며 주거용부터 상업용까지 폭넓은 적용 가능성을 강조한다. ASHP 확산 과정에서는 투자 대비 효과, 확장성, 지속가능성이라는 비즈니스 요구와 함께 극한 환경에서도 유지되는 신뢰성, 안정적인 제어와 통신, 에너지·환경 규제 준수라는 기술적 과제가 동시에 제기된다. 애로우는 이러한 복합 요구를 개별 기술 단위가 아닌 시스템 수준에서 통합적으로 설계해야 한다는 점을 핵심 전제로 제시한다. 특히 미국 혁신 및 제조법(AIM 법)에 따른 냉매 규제 변화는 HVAC 설계 전반의 구조적 전환을 촉발하고 있다. 2025년 이후 고(高) 지구온난화지수(GWP) 냉매 사용이 제한되면서 R-32, R-454B 등 저GWP 냉매로의 전환이 요구되고 있으며 이는 냉매 교체를 넘어 제어 로직, 센서 구성, 안전 메커니즘, 전력 전자 장치까지 포함한 시스템 아키텍처 전반의 재설계를 의미한다.

[인더스트리 솔루션 인사이트] 사람을 닮은 기계, 산업을 다시 쓰다

휴머노이드 로봇(Humanoid Robot)은 더 이상 먼 미래의 상상이 아니다. 산업과 사회 전반에서 ‘체화 AI(Embodied AI)’의 결정체로 자리매김하며, 새로운 패러다임 전환을 예고하고 있다. 이번 특집은 휴머노이드 혁명이 어떻게 진행되고 있는지, 그리고 왜 지금이 그 변곡점인지를 조망한다. 작은 온디바이스 AI(On-device AI)부터 정밀한 로봇 핸드, 실행 가능한 피지컬 AI(Physical AI)까지. 각 기사는 로봇이 단순한 기계적 존재를 넘어 스스로 판단하고 행동하는 지능형 주체로 진화하는 과정을 담고 있다. 이번 특집을 통해 독자들은 ‘움직이는 인공지능’의 현재와 미래를 입체적으로 이해할 수 있을 것이다. [특집] 사람을 닮은 기계, 산업을 다시 쓰다 [휴머노이드 로봇] 로봇의 다음 폼팩터는 ‘인간형’…현재진행형 ‘휴머노이드 혁명’ [로봇 핸드] 휴머노이드 완성의 열쇠 ‘로봇 핸드’…원익로보틱스, ‘정밀 조작’ 혁신에 힘 싣다 [온디바이스 AI] AI 시대, ‘작지만 똑똑한’ 로봇이 뜬다…이미 예고된 온디바이스 AI 혁명 [로봇 기술적 과제] 중국·미국은 달리고 있다…한국 로봇 기술, AI 접목으로 반격 시동 [피지컬 AI] 실행

[인더스트리 솔루션 인사이트] 비용에서 전략으로...물류 산업의 빅 리셋

물류 산업은 지금 거대한 전환의 한복판에 서 있다. 인공지능(AI)과 각종 플랫폼 기술이 촉발한 혁신은 단순히 배송 속도를 높이는 차원을 넘어, 물류를 첨단 전략 산업으로 재편하고 있다. 이번 특집은 이러한 흐름을 세 가지로 풀어냈다. 첫 번째는 물류가 ‘스마트’에서 ‘AI 물류’로 넘어가는 과정이다. 무인화·자동화·데이터 기반 운영은 이미 현장을 바꾸고 있으며, 글로벌 경쟁력 확보의 핵심이 되고 있다. 두 번째는 ‘화물 추적(Cargo Visibility)’이다. 단순한 위치 확인을 넘어 화물 상태와 리스크까지 실시간으로 관리하는 체계는 물류를 ‘비용’ 산업에서 ‘전략’ 산업으로 끌어올리고 있다. 마지막은 글로벌 무역 격변 속에서 중소 포워더의 생존 전략이다. 대기업과 IT 플랫폼이 주도하는 시장에서 서비스형 소프트웨어(SaaS) 기반 디지털 전환(DX)은 생존의 문제임을 보여준다. 중요한 것은 물류는 이제 국가 경제와 글로벌 경쟁력의 전면에 서 있는 미래 산업이라는 점이다. [특집] 비용에서 전략으로…물류 산업의 빅 리셋 [변화, 혁신 그리고 물류] AI와 플랫폼이 뒤흔드는 물류…혁신 없이는 버티기 힘들다 [Cargo Visibility] 물류가 전략 산

[인더스트리 솔루션 인사이트] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작

로봇은 더 이상 공장의 팔과 다리가 아니다. 그것은 인간이 무엇을 하고, 무엇을 하지 않아야 하는지를 다시 묻는 철학적 존재로 진화하고 있다. 산업용 로봇에서 피지컬 AI(Physical AI), 그리고 휴머노이드로 이어지는 변화의 흐름은 단순한 자동화의 진보가 아니다. 그것은 인간의 노동·공간·역할을 재정의하며, 사회 구조 전체를 다시 짜는 ‘문명적 전환’의 서막이다. 이번 특집은 그 전환의 최전선에 선 네 명의 전문가를 통해 로봇의 진짜 미래를 탐구한다. 김진오 한국AI·로봇산업협회장이 제시한 ‘로봇 트랜스포메이션(RX)’은 산업을 설계의 언어로 재해석하며, 류석현 한국기계연구원장이 이끄는 ‘K-휴머노이드’는 인간과 산업의 공진화를 그린다. 글렌 버세스 몬트리올대학교 교수는 데이터 생태계의 격차를, 데니스 홍 캘리포니아 대학교 로스앤젤레스 교수는 인간 중심의 로봇 철학을 말한다. 그들이 던지는 메시지는 하나다. "로봇은 인간을 대체하지 않는다. 인간을 확장한다” [특집] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작 [로봇 트랜스포메이션] “RX가 먼저, AX는 그다음”…로봇 트랜스포메이션이 바꾼 산업지도 [K-휴머노이드] “사람을 닮은 로

최신뉴스