[컴퓨텍스 2024] '블랙웰 넘어 루빈까지' 엔비디아가 만들 AI 유니버스

2024.06.04 08:53:46

서재창 기자 eled@hellot.net

 

SW부터 GPU와 CPU, AI 개발 플랫폼, 네트워크 인프라, 로보틱스 등 기술 로드맵 공개

 

AI 반도체 산업의 거물인 엔비디아 젠슨 황 CEO가 컴퓨텍스 2024에 나타났다. 

 

지난 2일 국립대만대학교 체육관에서는 젠슨 황 CEO가 발표하는 컴퓨텍스 2024 사전 키노트 행사가 열렸다. 전 세계에서 모인 6500여 명의 일반 참관객과 언론인은 굵은 빗줄기를 마다하지 않고 콘서트장을 방불케 하는 현장에서 젠슨 황을 보기 위해 줄을 서서 기다렸다. 

 

 

체육관에 들어서자, 대형화면에서는 엔비디아를 소개하는 화려한 영상이 나왔다. 이어 젠슨 황 CEO가 무대 위로 등장하자 많은 사람의 박수갈채가 이어지며, 두 시간에 달하는 키노트가 진행됐다. 젠슨 황은 "우리는 AI 시대에 살고 있다. 이와 더불어 생성형 AI는 무엇이며, 모든 산업에 어떤 영향을 미칠지, 우리는 이 놀라운 기회를 어떻게 활용할 것인지를 고민하는 시기를 지나가고 있다"고 인사말을 전했다. 

 

이날 젠슨 황은 대략적인 IT 기술의 역사부터 현 시대에 AI가 어떤 역할을 담당할 수 있는지에 대해 설명했다. 이와 함께 엔비디아의 AI 소프트웨어부터 GPU와 CPU, AI 개발 플랫폼, 네트워크 인프라, 로보틱스 등 그가 상상하는 AI의 미래를 하나씩 풀었다. 

 

 

젠슨 황 CEO는 올해 컴퓨텍스에서 화두가 될 AI PC에 대해 먼저 소개했다. RTX 기술로 구동되는 엔비디아 RTX AI PC는 200개 이상의 RTX AI 노트북과 500개 이상의 AI 기반 앱 및 게임으로 소비자 경험을 주도할 것으로 보인다. RTX AI 툴킷과 새롭게 제공되는 엔비디아 ACE 디지털 휴먼 플랫폼용 PC 기반 NIM 추론 마이크로서비스도 연이어 소개됐다. 

 

RTX 기반 AI 어시스턴트 기술 데모인 프로젝트 G-어시스트도 발표돼 PC 게임과 앱에 대한 상황 인식 지원 기술이 공개됐다. 이를 위해 엔비디아는 마이크로소프트와 개발자가 RTX 가속 SLM에 대한 간편한 API 액세스를 통해 윈도우 네이티브나 웹 앱에 새로운 생성형 AI 기능을 도입하도록 협력한다. RTX 가속 SLM은 윈도우 코파일럿 런타임의 일부로 디바이스에서 실행되는 RAG 기능을 지원한다.

 

이날 젠슨 황은 AI 시대의 도래를 앞당기기 위해 자사의 생성형 AI 개발을 위한 추론 마이크로서비스인 NIM을 공개했다. 그는 케이던스, 클라우데라, 코히시티, 데이터스택스, 넷앱, 스케일 AI, 시높시스 등 200여 개의 파트너사가 NIM을 그들의 플랫폼에 통합했다고 밝혔다. 파트너사들은 코파일럿, 코드 어시스턴트, 디지털 휴먼 아바타 등 도메인 특화 애플리케이션을 위한 생성형 AI 배포를 가속화하고 있다. 허깅페이스는 현재 메타 라마 3부터 NIM을 제공하고 있다. 

 

젠슨 황은 “오늘 허깅페이스에 최적화한 라마 3를 게시했으며, 곧바로 사용해볼 수 있다. 또한, 어디든 가져갈 수 있다. 모든 클라우드에서 실행하고, 이 컨테이너를 다운로드해 자체 데이터 센터에 설치한 다음 호스팅해 고객이 사용하도록 할 수 있다”고 말했다.

 

 

한편, 이날의 하이라이트는 엔비디아의 개발 로드맵에서 언급된 '루빈(Rubin)' 플랫폼이었다. 엔비디아의 차세대 플랫폼인 블랙웰(Blackwell)이 대중에 공개된지 불과 3개월만이다. 컴퓨텍스 키노트를 통해 처음으로 공개된 루빈 플랫폼은 곧 출시될 블랙웰의 뒤를 이을 예정이다. 루빈은 새로운 GPU, 새로운 Arm 기반 CPU인 베라, NV링크 6, CX9 슈퍼NIC, X1600 컨버지드 인피니밴드·이더넷 스위치를 탑재한 고급 네트워킹으로 구성돼 있다. 

 

젠슨 황은 루빈 GPU에 대만 TSMC의 3㎚ 공정 제품이 채택될 것이라면서, HBM4를 사용하는 최초의 GPU가 될 것이라고 설명했다. GPU에 6세대 고대역폭메모리(HBM)인 'HBM4'가 채택될 것이며, 양산 계획은 2026년 예정임을 밝혔다.

 

젠슨 황은 “엔비디아는 1년 주기로 움직인다. 우리는 전체 데이터 센터 규모를 구축하고, 1년 주기로 구성 부품을 판매하며, 모든 영역에서 기술의 한계까지 도달하려고 한다"고 말했다. 그는 엔비디아가 데이터를 인텔리전스로 전환하는 데 드는 비용에 대해 인지하고 있음을 언급했다.

 

젠슨 황은 GPU와 CPU의 조합이 어떻게 전력 소비를 3배만 증가시키면서 최대 100배의 속도 향상을 제공하는 동시에 CPU만 사용할 때보다 와트당 25배 더 높은 성능을 달성할 수 있는지에 대해 설명했다. 또한, “더 많이 구매할수록 더 많이 절약할 수 있다”며 이 접근 방식의 상당한 비용과 에너지 절감 효과를 강조했다.

 

 

이외에도 네트워킹 부문에서는 AI용 고성능 이더넷 네트워킹에 대한 수요 증가에 대응하기 위한 스펙트럼-X제품의 연간 출시 계획을 공개했다. AI용으로 구축된 최초의 이더넷 패브릭인 엔비디아 스펙트럼-X는 기존 이더넷 패브릭보다 네트워크 성능을 1.6배 이상 향상시키는 것으로 알려졌다.

 

기업들은 AI 워크로드의 처리, 분석, 실행을 가속화해 AI 솔루션의 개발과 배포를 가속화하는 데 활용할 것으로 보인다. 스펙트럼-X를 도입해 AI 인프라에 최적의 네트워킹 성능을 제공하는 AI 클라우드 서비스 제공업체로는 코어위브, GMO 인터넷 그룹, 람다, 스케일웨이, STPX 글로벌, 요타 등이 언급됐다. 

 

젠슨 황은 폭스콘이 엔비디아 옴니버스, 아이작, 메트로폴리스를 사용해 비전 AI와 로봇 개발 툴을 결합한 디지털 트윈을 만들어 로봇 설비를 개선한 사례도 소개했다. 젠슨 황은 “AI의 다음 물결은 물리적 AI다. 물리 법칙을 이해하는 AI, 사람과 함께 일할 수 있는 AI"라며 로봇과 AI의 중요성을 강조했다. 

 

엔비디아 아이작 플랫폼은 개발자가 젯슨 오린(Jetson Orin)과 토르(Thor)와 같은 AI 모델과 슈퍼컴퓨터로 구동되는 AMR, 산업용 로봇, 휴머노이드 등 AI 로봇을 제작하는 툴킷을 제공한다. 젠슨 황은 “모든 공장이 로봇화될 것이다. 공장은 로봇을 조율하고, 로봇은 로봇화된 제품을 생산하게 될 것"이라고 설명했다. 

 

젠슨 황은 BYD 일렉트로닉스, 지멘스, 테라다인 로보틱스, 인트린직과 같은 글로벌 기업이 엔비디아의 고급 라이브러리와 AI 모델을 활용해 공장과 창고 효율성을 높이는 데 있어 아이작이 중요한 역할을 한다고 강조했다. 

 

끝으로, 행사에서는 엔비디아와 대만과의 결속을 간접적으로 확인할 수 있는 영상이 소개됐다. 젠슨 황은 대만과 대만에 있는 여러 파트너사와의 협력 관계를 이어갈 의지를 표하며, 행사장을 참관객들에게 감사의 인사를 전했다. 

 

 

헬로티 서재창 기자 |

Copyright ⓒ 첨단 & Hellot.net





상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c) HelloT all right reserved.