엔비디아, 메타 라마 3.1 활용해 생성형 AI 구축 서비스 강화

URL복사

엔비디아가 메타의 오픈소스 AI 모델 컬렉션인 라마 3.1을 통해 새로운 서비스를 발표했다.

젠슨 황 "라마 3.1, 최첨단 생성형 AI 애플리케이션 구축할 수 있는 문 열어"

엔비디아가 메타의 오픈소스 AI 모델 컬렉션인 라마 3.1을 통해 전 세계 기업의 생성형 AI를 강화하는 엔비디아 AI 파운드리 서비스와 엔비디아 NIM 추론 마이크로서비스를 발표했다.

이제 기업과 국가는 엔비디아 AI 파운드리를 통해 라마 3.1과 엔비디아 소프트웨어, 컴퓨팅, 전문성을 활용해 도메인별 산업 사용 사례에 맞는 맞춤형 ‘슈퍼모델’을 만들 수 있다. 기업은 자체 데이터는 물론, 라마 3.1 405B와 엔비디아 네모트론 리워드 모델에서 생성된 합성 데이터로 이러한 슈퍼모델을 훈련할 수 있다.

엔비디아 AI 파운드리는 세계 최고의 퍼블릭 클라우드와 공동 설계된 엔비디아 DGX 클라우드 AI 플랫폼으로 구동된다. 이를 통해 AI 수요 변화에 따라 쉽게 확장할 수 있는 방대한 컴퓨팅 리소스를 기업에게 제공한다. 새로운 서비스는 기업뿐 아니라 독자적인 AI 전략을 개발 중인 국가들의 맞춤형 거대 언어 모델(LLM) 구축을 지원한다. 이들은 고유한 비즈니스나 문화를 반영하는 생성형 AI 애플리케이션을 위해 도메인별 지식을 갖춘 맞춤형 LLM을 구축하고자 한다.

엔비디아 창립자 겸 CEO인 젠슨 황은 “메타의 오픈소스 모델인 라마 3.1은 전 세계 기업에서 생성형 AI 채택하는 데 있어 중요한 순간이다. 라마 3.1은 모든 기업과 업계가 최첨단 생성형 AI 애플리케이션을 구축할 수 있는 문을 열었다. 엔비디아 AI 파운드리는 라마 3.1을 전체적으로 통합했으며, 기업이 맞춤형 라마 슈퍼모델을 구축하고 배포하도록 지원할 준비가 돼 있다”고 말했다.

메타의 창립자 겸 CEO인 마크 저커버그는 “새로운 라마 3.1 모델은 오픈소스 AI에 있어 중요한 단계다. 기업들은 엔비디아 AI 파운드리를 통해 사람들이 원하는 최첨단 AI 서비스를 쉽게 만들고 맞춤화하며, 엔비디아 NIM을 통해 배포할 수 있다. 이러한 서비스를 사람들에게 제공할 수 있게 돼 기쁘다”고 말했다.

엔비디아는 NIM 마이크로서비스가 프로덕션 환경에서 라마 3.1 모델을 배포하는 가장 빠른 방법이며, NIM 없이 추론을 실행하는 것보다 최대 2.5배 더 높은 처리량을 제공한다고 밝혔다. 기업은 라마 3.1 NIM 마이크로서비스를 새로운 엔비디아 네모 리트리버 NIM 마이크로서비스와 결합해 AI 코파일럿, 어시스턴트, 디지털 휴먼 아바타를 위한 최첨단 검색 파이프라인을 구축할 수 있다.

글로벌 전문 서비스 기업인 액센츄어는 자체 사용은 물론, 문화, 언어, 산업을 반영하는 생성형 AI 애플리케이션을 배포하고자 하는 고객을 위해 엔비디아 AI 파운드리를 최초로 채택했다. 또한, 액센츄어 AI 리파이너리 프레임워크를 사용해 맞춤형 라마 3.1 모델을 구축했다.

액센츄어의 회장 겸 CEO인 줄리 스위트(Julie Sweet)는 “세계 유수의 기업들은 생성형 AI가 각 산업을 어떻게 변화시키고 있는지를 확인하며, 맞춤형 모델 기반의 애플리케이션을 배포하고자 한다. 액센츄어는 내부 AI 애플리케이션을 위해 엔비디아 NIM 추론 마이크로서비스와 협력해 왔다. 그리고 이제 엔비디아 AI 파운드리를 통해 고객이 맞춤형 라마 3.1 모델을 신속하게 생성, 배포해 각자의 비즈니스 우선순위에 맞는 혁신적인 AI 애플리케이션을 구동하도록 지원하게 됐다"고 말했다.

엔비디아 AI 파운드리는 맞춤형 슈퍼모델을 빠르게 구축할 수 있는 엔드투엔드 서비스를 제공한다. 이는 엔비디아 소프트웨어, 인프라, 전문성 등을 개방형 커뮤니티 모델, 기술, 엔비디아 AI 에코시스템의 지원에 결합한다. 기업들은 엔비디아 AI 파운드리를 통해 라마 3.1 모델과 엔비디아 네모 플랫폼을 사용해 맞춤형 모델을 만들 수 있다. 여기에는 허깅 페이스 리워드 벤치에서 1위를 차지한 엔비디아 네모트론-4 340B 리워드 모델이 포함된다.

맞춤형 모델이 생성되면, 기업은 선호하는 클라우드 플랫폼과 글로벌 서버 제조업체의 엔비디아 인증 시스템에서 원하는 MLOps와 AIOps 플랫폼을 사용할 수 있다. 이를 통해 프로덕션 환경에서 실행할 수 있는 엔비디아 NIM 추론 마이크로서비스를 생성한다. 엔비디아 AI 엔터프라이즈 전문가와 글로벌 시스템 통합 파트너는 AI 파운드리 고객과 협력해 개발부터 배포에 이르는 전체 프로세스를 가속화한다.

도메인별 모델을 만들기 위해 추가 훈련 데이터가 필요한 기업은 맞춤형 라마 슈퍼모델을 만들 때 라마 3.1 405B와 네모트론-4 340B를 함께 사용해 합성 데이터를 생성하면 모델 정확도를 높일 수 있다. 자체 훈련 데이터를 보유한 고객은 도메인 적응형 사전 훈련(DAPT)을 위해 엔비디아 네모로 라마 3.1 모델을 맞춤화해 모델 정확도를 더욱 높일 수 있다.

아울러 엔비디아와 메타는 개발자가 생성형 AI 애플리케이션을 위한 소규모 맞춤형 라마 3.1 모델을 구축하는 데 사용할 수 있는 라마 3.1의 증류 레시피를 제공하기 위해 협력하고 있다. 이를 통해 기업은 AI 워크스테이션과 노트북 같은 광범위한 가속 인프라에서 라마 기반 AI 애플리케이션을 실행할 수 있다.

의료, 에너지, 금융 서비스, 소매, 운송, 통신 분야의 기업들은 이미 라마를 위한 엔비디아 NIM 마이크로서비스를 사용하고 있다. 새로운 라마 3.1용 NIM 마이크로서비스를 가장 먼저 도입한 기업 중에는 아람코, AT&T, 우버가 있다. 라마 3.1 다국어 LLM 컬렉션은 8B, 70B, 405B 파라미터 크기의 생성 AI 모델 모음이다. 이는 1만6000개 이상의 엔비디아 H100 텐서 코어 GPU에서 훈련되고, 데이터 센터, 클라우드, 엔비디아 RTX GPU가 탑재된 워크스테이션이나 지포스 RTX GPU가 탑재된 PC에서 엔비디아 가속 컴퓨팅과 소프트웨어에 최적화됐다.

기업은 검색 증강 생성(RAG)을 위한 새로운 엔비디아 네모 리트리버 NIM 추론 마이크로서비스를 사용한다. 이를 통해 맞춤형 라마 슈퍼모델과 라마 NIM 마이크로서비스를 프로덕션에 배포할 때 응답 정확도를 향상시킬 수 있다. 라마 3.1 405B용 엔비디아 NIM 추론 마이크로서비스와 결합된 네모 리트리버 NIM 마이크로서비스는 RAG 파이프라인을 위한 최고의 오픈, 상용 텍스트 Q&A 검색 정확도를 제공한다.

기업, 데이터, 인프라 플랫폼을 제공하는 수백 개의 엔비디아 NIM 파트너는 이제 자사의 AI 솔루션에 새로운 마이크로서비스를 통합한다. 이로써 5백만 명 이상의 개발자와 1만9000개 이상의 스타트업으로 구성된 엔비디아 커뮤니티를 위해 생성형 AI를 강화할 수 있다. 라마 3.1 NIM과 네모 리트리버 NIM 마이크로서비스에 대한 프로덕션 지원은 엔비디아 AI 엔터프라이즈를 통해 제공된다. 엔비디아 개발자 프로그램 회원은 자신이 선호하는 인프라에서 연구, 개발, 테스트를 위해 NIM 마이크로서비스에 무료로 액세스할 수 있다.

헬로티 서재창 기자 |

[인더스트리 솔루션 인사이트] AW 2026 주목할 베스트 솔루션 (2편)

제36회 스마트공장·자동화산업전(AW 2026)은 제조 인공지능 전환(AX) 시대를 관통하는 산업·공장 자동화(FA) 및 스마트 팩토리(Smart Factory) 기술의 현재와 미래를 집약적으로 보여주는 아시아 최대 산업자동화 전시회다. 내년 전시 현장에서는 제조 경쟁력을 좌우할 솔루션이 등판했고, 이를 기반으로 한 전시회는 각종 산업의 전략이 교차하는 바로미터 역할을 해왔다. 그동안 AW에서 소개된 수많은 기술과 제품은 국내 제조기업의 체질을 강화하고 글로벌 시장에서 차별화된 경쟁력을 확보하는 토대가 됐다. 이번 특집에서는 내년 3월 열리는 AW 2026에 참가한 기업들 가운데, 제조 AX 시대를 이끌 주목할 만한 제품과 솔루션을 조명한다. [특집] AW 2026 주목할 베스트 솔루션 (2편) [스마트 물류] 공장은 이미 자동화됐다, 문제는 ‘물류의 뇌’ [스마트 제조 SW] 데이터 끊김 없는 공장…“ERP·MES 유기적 결합이 지능형 공장 이끌어” [로보틱스] 중국서 검증된 로봇 하드웨어 파워, 국내 로봇 제조 시장의 ‘메기 효과’ 될까 [스마트 물류] 바퀴 달린 모든 것을 AMR로…업계가 ‘맞춤형 자율주행’에 주목하는 이유 [제조 AI] 제조 AI 성공

애로우, 공기열원 히트펌프로 보는 차세대 HVAC 설계 전략

애로우 일렉트로닉스(이하 애로우)가 공기열원 히트펌프(ASHP)를 탈탄소화와 에너지 효율 향상을 동시에 실현하는 차세대 HVAC 시스템의 핵심 대안으로 제시했다. 애로우는 ASHP를 단순한 냉난방 설비가 아닌 규제 대응, 지속가능성 전략, 시장 차별화를 함께 충족하는 확장 가능한 플랫폼으로 정의하며 주거용부터 상업용까지 폭넓은 적용 가능성을 강조한다. ASHP 확산 과정에서는 투자 대비 효과, 확장성, 지속가능성이라는 비즈니스 요구와 함께 극한 환경에서도 유지되는 신뢰성, 안정적인 제어와 통신, 에너지·환경 규제 준수라는 기술적 과제가 동시에 제기된다. 애로우는 이러한 복합 요구를 개별 기술 단위가 아닌 시스템 수준에서 통합적으로 설계해야 한다는 점을 핵심 전제로 제시한다. 특히 미국 혁신 및 제조법(AIM 법)에 따른 냉매 규제 변화는 HVAC 설계 전반의 구조적 전환을 촉발하고 있다. 2025년 이후 고(高) 지구온난화지수(GWP) 냉매 사용이 제한되면서 R-32, R-454B 등 저GWP 냉매로의 전환이 요구되고 있으며 이는 냉매 교체를 넘어 제어 로직, 센서 구성, 안전 메커니즘, 전력 전자 장치까지 포함한 시스템 아키텍처 전반의 재설계를 의미한다.

[인더스트리 솔루션 인사이트] 사람을 닮은 기계, 산업을 다시 쓰다

휴머노이드 로봇(Humanoid Robot)은 더 이상 먼 미래의 상상이 아니다. 산업과 사회 전반에서 ‘체화 AI(Embodied AI)’의 결정체로 자리매김하며, 새로운 패러다임 전환을 예고하고 있다. 이번 특집은 휴머노이드 혁명이 어떻게 진행되고 있는지, 그리고 왜 지금이 그 변곡점인지를 조망한다. 작은 온디바이스 AI(On-device AI)부터 정밀한 로봇 핸드, 실행 가능한 피지컬 AI(Physical AI)까지. 각 기사는 로봇이 단순한 기계적 존재를 넘어 스스로 판단하고 행동하는 지능형 주체로 진화하는 과정을 담고 있다. 이번 특집을 통해 독자들은 ‘움직이는 인공지능’의 현재와 미래를 입체적으로 이해할 수 있을 것이다. [특집] 사람을 닮은 기계, 산업을 다시 쓰다 [휴머노이드 로봇] 로봇의 다음 폼팩터는 ‘인간형’…현재진행형 ‘휴머노이드 혁명’ [로봇 핸드] 휴머노이드 완성의 열쇠 ‘로봇 핸드’…원익로보틱스, ‘정밀 조작’ 혁신에 힘 싣다 [온디바이스 AI] AI 시대, ‘작지만 똑똑한’ 로봇이 뜬다…이미 예고된 온디바이스 AI 혁명 [로봇 기술적 과제] 중국·미국은 달리고 있다…한국 로봇 기술, AI 접목으로 반격 시동 [피지컬 AI] 실행

[인더스트리 솔루션 인사이트] 비용에서 전략으로...물류 산업의 빅 리셋

물류 산업은 지금 거대한 전환의 한복판에 서 있다. 인공지능(AI)과 각종 플랫폼 기술이 촉발한 혁신은 단순히 배송 속도를 높이는 차원을 넘어, 물류를 첨단 전략 산업으로 재편하고 있다. 이번 특집은 이러한 흐름을 세 가지로 풀어냈다. 첫 번째는 물류가 ‘스마트’에서 ‘AI 물류’로 넘어가는 과정이다. 무인화·자동화·데이터 기반 운영은 이미 현장을 바꾸고 있으며, 글로벌 경쟁력 확보의 핵심이 되고 있다. 두 번째는 ‘화물 추적(Cargo Visibility)’이다. 단순한 위치 확인을 넘어 화물 상태와 리스크까지 실시간으로 관리하는 체계는 물류를 ‘비용’ 산업에서 ‘전략’ 산업으로 끌어올리고 있다. 마지막은 글로벌 무역 격변 속에서 중소 포워더의 생존 전략이다. 대기업과 IT 플랫폼이 주도하는 시장에서 서비스형 소프트웨어(SaaS) 기반 디지털 전환(DX)은 생존의 문제임을 보여준다. 중요한 것은 물류는 이제 국가 경제와 글로벌 경쟁력의 전면에 서 있는 미래 산업이라는 점이다. [특집] 비용에서 전략으로…물류 산업의 빅 리셋 [변화, 혁신 그리고 물류] AI와 플랫폼이 뒤흔드는 물류…혁신 없이는 버티기 힘들다 [Cargo Visibility] 물류가 전략 산

[인더스트리 솔루션 인사이트] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작

로봇은 더 이상 공장의 팔과 다리가 아니다. 그것은 인간이 무엇을 하고, 무엇을 하지 않아야 하는지를 다시 묻는 철학적 존재로 진화하고 있다. 산업용 로봇에서 피지컬 AI(Physical AI), 그리고 휴머노이드로 이어지는 변화의 흐름은 단순한 자동화의 진보가 아니다. 그것은 인간의 노동·공간·역할을 재정의하며, 사회 구조 전체를 다시 짜는 ‘문명적 전환’의 서막이다. 이번 특집은 그 전환의 최전선에 선 네 명의 전문가를 통해 로봇의 진짜 미래를 탐구한다. 김진오 한국AI·로봇산업협회장이 제시한 ‘로봇 트랜스포메이션(RX)’은 산업을 설계의 언어로 재해석하며, 류석현 한국기계연구원장이 이끄는 ‘K-휴머노이드’는 인간과 산업의 공진화를 그린다. 글렌 버세스 몬트리올대학교 교수는 데이터 생태계의 격차를, 데니스 홍 캘리포니아 대학교 로스앤젤레스 교수는 인간 중심의 로봇 철학을 말한다. 그들이 던지는 메시지는 하나다. "로봇은 인간을 대체하지 않는다. 인간을 확장한다” [특집] 로봇이 다시, 인간을 정의하다...휴머노이드 AI 시대 시작 [로봇 트랜스포메이션] “RX가 먼저, AX는 그다음”…로봇 트랜스포메이션이 바꾼 산업지도 [K-휴머노이드] “사람을 닮은 로

최신뉴스