인공지능(AI) 산업의 기술 판도가 흔들리는 양상이다. 모델 크기와 추론 속도를 주요 경쟁 요소로 삼았던 기존 트렌드가 전환되는 모습. 이제 시장은 기업 업무를 대행하는 '에이전트(Agent)', 토큰(Token)을 생산하는 'AI 공장(AI Factory)', 모니터 화면에서 벗어나 실제 하드웨어를 구동하는 ‘피지컬 AI(Physical AI)’로 향하는 모양새다.
데이터센터 역시 단순한 서버의 집합체에서 벗어나 전력·냉각·네트워크·보관소·보안·소프트웨어등을 통합 설계하는 인프라로 진화하는 추세다.
이 가운데 토큰은 생성형 AI(Generative AI)가 텍스트·명령을 처리하고 결과를 출력할 때 사용하는 기본 단위다. 컴퓨터는 사람처럼 문장 전체를 한 번에 이해하지 못하고, 글자를 잘게 쪼개서 인식한다. 쉽게 말해, 토큰은 그 쪼개진 글자 한 조각 한 조각을 뜻하는 것이다.
글로벌 컴퓨팅 기술 업체 엔비디아(NVIDIA)의 수장 젠슨 황(Jensen Huang) 최고경영책임자(CEO)는 AI 팩토리를 토큰을 생산하는 시설로 규정하며, 컴퓨팅 성능을 수익 구조와 직접 연결했다.
그에 따르면, 에이전트는 이 패러다임 전환의 핵심 근간이다. 단순 답변 생성 프로그램이 아니라, 상황을 맥락적으로 읽고 계획을 수립하며 도구를 호출한 뒤 결과까지 재검증하는 독립된 작업 단위라는 설명. 이 같은 작업 단위가 산업 전반에 배치되면서 컴퓨팅 아키텍처의 전면적인 재설계가 요구된다. 그래픽처리장치(GPU)부터 중앙처리장치(CPU)·저장장치·네트워크·런타임(Runtime) 등 계층이 에이전트 실행 경로에 종속되기 때문이다.
젠슨 황 CEO는 이달 1일(현지시간) 자사 AI·GPU 분야 개발자 콘퍼런스 ‘엔비디아 GTC 타이베이 2026(NVIDIA GTC Taipei 2026)’ 개막 키노트에서 이 같은 구조적 변화를 제시했다.
에이전틱 AI(Agentic AI)를 시작으로, 제조·자율주행·로봇공학에 이르는 전방위적 기술 생태계를 유기적으로 엮었다. 실제 물리 환경과 산업 현장 전반에 AI 인프라를 안착시키기 위한 생태계의 판짜기다.
"일자리 감소는 오판"...개발자 생산성을 극대화하는 에이전트 시대의 서막
황 CEO는 키노트 초반부터 에이전틱 AI를 이번 발표의 출발점으로 내세웠다. 실제로 그는 “에이전틱 AI가 도착했다. 유용한 AI가 도착했다(agentic AI has arrived, useful AI has arrived)”고 말했다. 무대에 처음 오른 장면은 소프트웨어 개발자가 프롬프트를 입력하고, AI가 코드를 만들 후, 도구 호출, 결과물 완성 등을 수행하는 작업 흐름을 구현했다.
그는 개발자 협업 플랫폼 ‘깃허브(GitHub)’의 사용량 증가를 예로 들며 AI가 개발 생산성을 끌어올리고 있다고 진단했다. CEO에 따르면, 에이전틱 AI는 개발자를 대체하는 신호가 아니다. 그는 “AI가 일자리를 줄인다는 말은 완전히 틀렸다”며 “AI가 더 많은 소프트웨어 개발자와 더 많은 도구 수요를 만든다”고 설명했다. AI가 생산성을 높일수록 기업은 더 많은 개발자를 필요로 하고, 에이전트가 사용할 도구도 늘어난다는 분석이다.
이처럼 늘어나는 도구 수요를 뒷받침하기 위해 엔비디아는 에이전트 아키텍처를 새롭게 정립했다. 구조는 사고를 담당하는 모델을 중심으로 하네스(Harness)·도구·메모리·런타임이 맞물리는 형태다.
여기서 핵심 가교인 하네스가 모델·메모리·런타임뿐 아니라 웹브라우저·스프레드시트·데이터베이스·시뮬레이터 등 각종 외부 도구(Tool)을 통합한다. 기존 애플리케이션이 정형화된 운영체제 틀 안에서만 움직였다면, 에이전트는 이 아키텍처를 기반으로 복잡한 작업(Task)을 주도적으로 해결한다. 이 과정에서 AI의 사고력과 최적의 도구를 자유자재로 교차 활용한다는 게 황 CEO의 언급이다.
이때 엔비디아는 자사 가속 컴퓨팅 라이브러리 ‘쿠다-X(CUDA-X)’를 에이전트 시대의 도구로 제시했다. 개발자가 호출하던 라이브러리를 에이전트가 사용할 수 있는 스킬(Skill) 형태로 제공한다는 구상이다. 젠슨 황은 “에이전트가 많아질수록 도구를 더 많이 쓰게 된다”며 소프트웨어 생태계의 역할 확대를 강조했다.
하드웨어와 시설 인프라의 동시 설계, 시장은 컴퓨터가 아닌 공장을 원해
이날 키노트의 중심은 토큰을 토대로 한 AI 팩토리였다. 젠슨 황은 “현시점 사용자·파트너는 이전처럼 컴퓨터를 사고 싶어 하는 것이 아니다”라며 “결국은 AI 팩토리를 만들고 싶어 한다(They want to build AI factories)”고 주장을 펼쳤다.
이 공장은 칩(Chip)·랙(Rack)·네트워크·전력·냉각·전력망(Grid)·운영소프트웨어 등이 하나의 설계 단위로 움직여야 한다. 황 CEO는 칩과 시설 인프라의 동시 설계를 강조했다. 이 구간에서 AI 팩토리 설계·배포·운영 청사진인 ‘엔비디아 DSX 플랫폼(NVIDIA DSX Platform)’이 공개됐다.
엔비디아는 이 DSX를 모듈형 오픈소스 소프트웨어 라이브러리, API(Application Programming Interface), 레퍼런스 디자인, 가속 컴퓨팅 플랫폼, 파트너 기술 등이 결합된 통합 플랫폼으로 설명했다. 칩·랙부터 시설 인프라와 운영 소프트웨어까지 하나의 범주로 다루는 구조다.
이 가운데 ‘DSX 심(DSX Sim)’은 랙이 들어오기 전 디지털 환경에서 구축·전력·냉각·네트워크 등 구성을 미리 검증한다. 이어 ‘DSX OS’는 AI 팩토리 구축 이후 인프라 지원 할당(Provisioning), 운영, 모니터링, 복원 등을 맡는다. 이후 ‘DSX 맥스LPS(DSX MaxLPS)’는 제한된 전력 안에서 메가와트(MW)당 토큰 처리 성능을 높이는 기술 제품군이다.
CEO의 발표에 따르면, DSX 맥스LPS는 45° 액체 냉각과 랙 내부 전력 최적화 기술을 결합한다. 같은 전력 한도에서 더 많은 GPU를 운용하고 워크로드 성능 저하를 줄이는 방식을 채택했다는 것. 이 같은 DSX의 전력망 연계 기능은 실시간 그리드 신호를 읽고 AI 팩토리의 전력 소비와 워크로드를 조정하는 구조로 소개됐다. 엔비디아는 AI 팩토리를 전력 조건에 반응하는 산업 자산으로 제시했다.
그러면서 이 공장에 대해 수익을 만드는 생산 시설로 규정하기도 했다. 그는 “컴퓨트는 매출이고, 와트당 성능은 매출(Compute is revenues. Performance per watt is your revenues)”이라며 AI 팩토리의 경제성을 전력 효율과 연결했다. 이 관점에서는 첫 토큰까지 걸리는 시간, 와트당 처리량, 시스템 신뢰성, 자산 수명이 모두 경제성 지표가 된다.
이 대목에서 엔비디아의 전략도 달라졌다. 이날 공론화된 구조는 엔비디아가 GPU 회사에서 시스템 회사로, 다시 AI 인프라 회사로 진화한다는 점이 부각됐다.
에이전트 구동을 위해 태어난 다중 랙 플랫폼 '베라 루빈'
앞선 AI 팩토리를 구동하는 핵심 하드웨어 인프라의 중심에는 ‘엔비디아 베라 루빈(NVIDIA Vera Rubin)’이 논의됐다. 베라 루빈은 에이전틱 AI 기반 공장을 위한 다중 랙 규모 플랫폼이다.
이 기술 방법론에는 ▲베라 루빈 NVL72(Vera Rubin NVL72) ▲베라 CPU(Vera CPU) ▲베라 블루필드-4 STX(Vera BlueField-4 STX) ▲스펙트럼-X 이더넷 랙(Spectrum-X Ethernet Rack) ▲스토리지 ▲네트워크 등이 하나의 시스템을 구성한다.
다시 말해, 계산을 담당하는 CPU·GPU와 함께, 초고속 통신망과 저장장치까지 거대 소프트웨어 공장처럼 하나의 패키치로 통합된 슈퍼 컴퓨터다.
젠슨 황은 이 베라 루빈을 에이전트를 실행하기 위해 만든 시스템으로 설명했다. 기존 인프라가 학습과 추론에 초점을 맞췄다면, 베라 루빈은 에이전트가 관찰·추론·계획하고, 도구를 사용하는 흐름을 처리한다는 것이다. 한 번의 요청 안에서도 모델 호출, 데이터 검색, 코드 실행, 보안 검증, 메모리 접근이 반복된다.
그는 “베라 루빈은 단지 AI를 실행하기 위해 만든 것이 아니다. 에이전트를 실행하기 위해 만든 시스템”이라고 언급했다. 이는 베라 루빈의 성격을 단순 차세대 GPU 플랫폼에서 에이전틱 AI 처리 인프라로 규정하는 대목이다.
사측은 베라 루빈이 5개 전용 랙이 하나의 대규모 AI 슈퍼 컴퓨터처럼 작동하는 ‘포드(POD)’, 즉 독립된 대형 인프라 구축 플랫폼이라고 소개했다. 젠슨 황 CEO는 대규모 환경에서 이전 세대 AI 슈퍼 컴퓨터 플랫폼 ‘그레이스 블랙웰(Grace Blackwell)’ 대비 에이전트 처리량을 최대 10배 높인다고 제시했다.
아울러 사측의 CPU도 새 역할을 맡았다. ‘엔비디아 베라 CPU(NVIDIA Vera CPU)’는 에이전트의 도구 호출과 데이터 처리를 겨냥한 프로세서다. 젠슨 황은 “이전 CPU가 사람을 위해 만들어졌다면, 베라는 에이전트를 위해 만들어진 CPU”라며 설계 목적을 내세웠다.
에이전트는 나노초(ns) 단위의 미세한 지연에도 민감하게 반응하기 때문이다. 만약 도구 호출이나 데이터 접근이 조금이라도 늦어지면, GPU 가동률이 떨어지면서 결국 최종 결과물인 토큰 생산량까지 급감하게 된다. 이와 관련해 그는 “CPU도 에이전트 시대에 맞춰 다시 설계돼야 한다”며 CPU의 역할 변화를 짚었다. 베라 CPU는 에이전트 컴퓨팅 경로의 병목을 푸는 구성 요소로 소개됐다.
사용자 이해하고 대리 행동하는 '개인용 컴퓨터 비서' 오나
엔비디아의 시선은 서버실에만 머물지 않았다. 키노트 중반, 무대는 PC로 전환됐다. PC라는 하드웨어의 정의를 뒤흔드는 선언을 내놨다. 젠슨 황이 정의한 미래의 PC는 사용자의 의도를 읽고, 로컬 파일을 스스로 분석하며, 최적의 툴을 꺼내 업무를 대행하는 ‘개인용 에이전트 컴퓨터’다.
그 전초전이 바로 ‘엔비디아 RTX 스파크(NVIDIA RTX Spark)’다. Arm 기반 ‘그레이스 CPU(Grace CPU)’, ‘블랙웰 RTX GPU(Blackwell RTX GPU)’, 통합 메모리 등을 마이크로소프트의 운영체제(OS) 윈도우(Windows) 환경에 통합했다.
기업 환경을 겨냥한 ‘윈도우용 엔비디아 DGX 스테이션(NVIDIA DGX Station for Windows)’도 베일을 벗었다. 책상 위에 올려두고 쓰는 데스크사이드(Desktop-side) AI 슈퍼 컴퓨터다. 개발자·연구원·엔지니어 등 기업 내 인원이 서버 인프라를 거치지 않고도 고성능 대규모 AI 모델과 에이전트를 자신들의 자리에서 직접 구축하고 실행할 수 있다는 설명이다.
이번 PC 부문 발표의 본질은 PC의 역할을 '로컬 에이전트 구동 플랫폼'으로 전환시키겠다는 사측의 메시지로 해석된다. “PC는 다시 발명되고 있다”는 젠슨 황의 선언대로다. 필요할 때만 클라우드와 유기적으로 연동할 뿐, 평소에는 사용자 PC 속 개인 파일과 설계·창작 도구를 직접 호출하며 작업을 주도하는 새로운 아키텍처가 공개된 것.
피지컬 AI의 '빅뱅'..."로봇에 필요한 건 인간의 글이 아닌 1인칭 시점의 세계"
후반부의 무게는 피지컬 AI로 향했다. 젠슨 황 CEO는 에이전틱 AI를 디지털 로봇으로 정의한 뒤, “동일한 작동 패턴이 차량·공장·휴머노이드(Humanoid)·위성·기지국·장비에 그대로 적용된다”고 짚었다. AI가 현실 환경의 장비를 직접 구동하는 시대로 진입했다는 뜻이었다.
이 배경에서 그가 꼽은 최대 난제는 ‘데이터’다. 기존 거대언어모델(LLM)이 인터넷에 축적된 인간의 텍스트를 먹고 자랐다면, 로봇은 접근 방식부터 달라야 한다는 주장이다. 젠슨 황은 “로봇에는 인간의 글이 아니라 로봇의 시점에서 본 세계가 필요하다”며 데이터 병목 문제를 지적했다. 카메라, 센서 값, 로봇 손(Robot Hand) 움직임, 이동 경로, 주변 환경, 물체와의 접촉 정보 등이 핵심 학습 재료가 되는 구조를 제시한 모습이다.
이 가운데 그는 이 로봇 데이터를 확보할 단계적 방법론을 제시했다. 시작점은 인간의 시연과 원격 제어(Teleoperation)다. 이어 시뮬레이션을 통해 학습 환경을 기하급수적으로 늘린 뒤, 제3자 시점 데이터를 로봇의 1인칭 시점으로 재구성하는 단계를 거친다. 최종적으로는 물리 세계를 어떤 시점에서든 이해·생성할 수 있는 ‘월드 파운데이션 모델(World Foundation Model)’로 수렴한다.
이 과정에서 피지컬 AI 전용 오픈 월드 파운데이션 모델 ‘엔비디아 코스모스 3(NVIDIA Cosmos 3)’가 공개됐다. 젠슨 황은 “피지컬 AI의 빅뱅이 곧 도래할 것(The Big Bang of Physical AI is coming soon)”이라며 강한 자신감을 드러냈다. 코스모스 3는 물리 환경을 인식·추론하며, 계획을 세워 행동하는 로봇과 자율주행 자동차 개발의 핵심 기반 역할을 맡을 것으로 전망된다.
사측에 따르면, 코스모스 3는 로봇 개발의 전천후 기반 모델로 배치됐다. 비전·언어(VL) 모델로 주변 장면을 파악하고, 월드 모델로 미래 상태를 예측해 합성 영상을 만든다. 이후 시뮬레이터 안에서 정책 학습과 평가를 순환 형태로 지원한다. 나아가 비전·언어·행동(VLA) 모델로 활용될 경우 로봇의 실질적인 행동 생성까지 직접 관여한다.
현장에서는 대규모 오픈소스 피지컬 AI 에이전트 도구와 스킬 모음까지 포함하는 통합 기술 체계(Stack)가 공개됐다. 로보틱스, 자율주행차, 비전 AI(Vision AI), 산업용 디지털 트윈(Digital Twin) 워크플로 등을 에이전트가 실행할 수 있는 작업으로 전환해 주는 장치다. 젠슨 황은 “피지컬 AI에는 데이터가 필요하지만, 실제 세계 데이터는 확장하기 어렵다(Physical AI needs data, but real world data is impossible to scale)”는 언급으로 이 도구들의 당위성을 설파했다.
이로써 로봇을 개발하는 패러다임도 바뀔 것이라는 관측도 내놨다. 이전처럼 하드웨어를 조립하고 제어 코드를 짜는 방식만으로는 피지컬 AI를 구현할 수 없다는 게 그 배경. 이제는 데이터 생성부터 합성 데이터 구축, 시뮬레이션, 정책 학습, 에지(Edge) 배포, 안전 검증 등이 하나의 파이프라인으로 연결될 것이라는 예측이다. 엔비디아는 이 흐름을 통제하기 위해 전용 하드웨어·소프트웨어 플랫폼을 배치했다.
그 중심축인 ‘엔비디아 코스모스(NVIDIA Cosmos)’는 현실 환경을 이해하는 오픈 월드 파운데이션 모델이며, ‘엔비디아 옴니버스(NVIDIA Omniverse)’는 로봇이 활동할 가상 공간을 구축하는 디지털 트윈 플랫폼이다.
여기에 로봇의 AI 시뮬레이션·훈련을 담당하는 ‘엔비디아 아이작(NVIDIA Isaac)’, 로봇의 두뇌 역할로 현장 배포를 지원하는 AI 에지 컴퓨팅 하드웨어 솔루션 ‘엔비디아 젯슨(NVIDIA Jetson)’이 유기적으로 맞물린다. 아울러 비전 AI 기술로 주변 환경을 모니터링하고 안전을 검증하는 ‘엔비디아 메트로폴리스(NVIDIA Metropolis)’와 산업용 에이전트 워크플로우를 최적화하는 핵심 스택 ‘엔비디아 알파마요(NVIDIA Alpamayo)’가 결합된다.
차량도 로봇이다? 주변 환경 해석하는 자동차는 로봇으로 진화 중
앞서 언급한 피지컬 AI의 단일 기술 스택 전략은 자율주행차와 로보택시(Robotaxi) 언급을 통해 구체적인 상용화 가능성을 예상케 했다. 엔비디아는 자율주행 기술 수준 레벨 4(Level 4)의 자율주행차 개발을 겨냥한 추론 기반 VLA 모델인 ‘엔비디아 알파마요 2 슈퍼(NVIDIA Alpamayo 2 Super)’를 대안으로 내놨다. 이 모델은 320억 개의 매개변수(Parameter) 규모를 갖춘 오픈 추론 모델로 알려졌다.
젠슨 황 CEO는 로보택시 부문을 소개하며 “자동차는 로봇으로 진화하고 있다(Cars are becoming robots)”고 선언했다. 그러면서 “미래의 로보택시는 단순히 정해진 경로를 따라 이동하는 주체에서 벗어나, 주변 상황을 스스로 해석하고 판단 근거를 추적하며 행동을 선택하는 고도의 피지컬 AI 시스템”이라는 의미를 명확히 했다.
차량의 안전성을 확보하기 위한 시뮬레이션 인프라도 대거 확충됐다. 엔비디아는 실제 도로 배포 전 단계를 지원하는 개발 도구로 ‘엔비디아 알파짐(NVIDIA AlpaGym)’, ‘엔비디아 옴니드림스(NVIDIA OmniDreams)’, ‘엔비디아 옴니버스 뉴렉(NVIDIA Omniverse NuRec)’을 함께 제시했다. 가상 환경에서의 순환 훈련, 시뮬레이션, 합성 데이터(Synthetic Data) 생성을 유기적으로 구동하기 위한 목적이다.
실질적인 로보택시 생태계의 기반으로는 ‘엔비디아 드라이브 하이페리온(NVIDIA DRIVE Hyperion)’ 플랫폼을 제안했다. 차량용 고성능 컴퓨터와 안전 운영체제(OS), 센서 제품군, 자율주행 소프트웨어를 하나로 통합한 아키텍처다. 현시점 엔비디아는 폭스콘·빈패스트·오토브레인스·우버·휴메인 등 글로벌 업체와의 협력을 바탕으로, 레벨 4 로보택시 도입을 본격 확대한다는 방침이다.
이러한 차량 분야 혁신 방법론은 자율주행차가 결국 도로 위를 달리는 로봇임을 암시한다. 센서, 컴퓨팅 파워, 안전 소프트웨어, 가상 시뮬레이션, 실제 현장 배포에 이르는 과정이 자연스럽게 흘러야 한다. 휴머노이드와 스마트 팩토리(Smart Factory) 로봇이 직면한 기술적 과제가 자동차 시장에서 먼저 대규모 상용화 형태로 구현된 셈이다.
반도체 제조 패러다임을 바꾸는 가속 연산 소프트웨어의 힘
대만 공급망은 이날 기조 연설의 또 다른 핵심 중 하나였다. 젠슨 황 CEO는 오프닝부터 칩 설계·제조, 패키징, 서버 조립, 랙 통합, 냉각, 검증 역량 등이 AI 인프라의 생산 조건으로 강조했다.
이 가운데 대만 소재 파운드리 업체 TSMC는 이 구조 안에서 하나의 대표 사례로 언급됐다. 엔비디아는 TSMC가 자사 가속 컴퓨팅과 AI를 반도체 설계·제조 공정에 적용하고 있다고 밝혔다. 적용 영역은 컴퓨팅 노광 공정(Lithography), 트랜지스터(Transistor)·공정 시뮬레이션, 첨단 공정 제어, 팹 운영 최적화다.
공정 소프트웨어도 마찬가지다. 엔비디아 cu리소(cuLitho)는 칩 마스크 설계를 위한 리소그래피 인쇄 공정에 활용된다. 엔비디아는 TSMC가 반도체 제조 과정에 자사 소프트웨어와 AI 모델을 적용하고 있다고 설명했다.
칩 회로를 웨이퍼에 새기기 전 마스크 설계를 계산하는 데는 ‘엔비디아 cuLitho(NVIDIA cuLitho)’가 쓰인다. 반도체 소재와 공정 조건을 가상으로 계산하는 영역에는 ‘엔비디아 cuEST(NVIDIA cuEST)’가 그리고 공정 장비에서 나오는 데이터를 분석하고, AI 모델이 읽을 수 있는 형태로 정리하는 작업에는 ‘엔비디아 cuML(NVIDIA cuML)’이 적용됐다.
팹 운영에는 디지털 트윈 기법이 도입됐다. TSMC가 검토 중인 옴니버스 기반 팹트윈(FabTwin)은 실제 구축 전 가상 환경에서 공정 장비 배치와 시뮬레이션 워크플로를 평가하는 구조다.
이때 대만의 역할은 베라 루빈 생산 체계에서 눈에 띈다. 엔비디아는 베라 루빈을 생산하기 위해 서버·랙을 조립할 때 쓰는 공통 설계 규격 ‘엔비디아 MGX(NVIDIA MGX)’를 활용하고 있다. 이 설계 규격을 기반으로 30개국 350개 이상 공장에서 베라 루빈 생산을 확대하고 있고, 대만에서만 150개 기업이 이 생산 체계에 참여한다.
젠슨 황은 “우리는 대만과 함께 AI 시대의 컴퓨팅을 다시 발명했다”며 “대만은 엔비디아와 함께 새로운 컴퓨팅 산업의 기반을 만들고 있다”고 말했다.
이날 키노트는 개최지 이상의 성격을 가졌다. AI 인프라의 생산 현장이자 검증 현장이었다. 칩을 대규모 시스템으로 만들고, 안정적으로 공급할 수 있는 제조 생태계의 경쟁이다.
헬로티 최재규 기자 |



















































