지금 엔비디아(NVIDIA)가 한국에서 찾는 주체는 단순한 그래픽처리장치(GPU) 구매자가 아니다. 자신들이 이미 구축한 인공지능(AI) 인프라와 컴퓨팅 자원을 전제로, 산업 구조 자체를 AI·로봇 중심으로 새롭게 재편하려는 팀을 주시하고 있다.
이는 생산·물류·서비스·콘텐츠·플랫폼 등 거의 모든 핵심 산업 영역을 포괄하는 전략적 움직임이다. 이처럼 엔비디아는 단일 솔루션이나 시범(Pilot) 프로젝트가 아니라, AI·로봇 기반 비즈니스 모델을 어떻게 설계할 것인가를 보여줄 주체를 찾고 있다.
이러한 팀들을 한 무대에 세워 문제의식과 해법을 공유한 자리가 ‘엔비디아 인셉션 스타트업 & VC 리셉션(NVIDIA Inception Startup & VC Reception)’이다. 이 프로그램은 엔비디아의 글로벌 스타트업 지원 프로그램 '엔비디아 인셉션(NVIDIA Inception)'의 일환이다. AI, 데이터 과학, 고성능 컴퓨팅(HPC) 등 분야에서 혁신을 추구하는 스타트업과 이들에게 투자하는 벤처캐피털(VC)을 연결해 교류를 촉진하는 글로벌 네트워킹 행사다.
우리나라에서는 지난 17일 국내 개발자·스타트업을 대상으로 한 AI 기술 행사 ‘엔비디아 AI 데이 서울(NVIDIA AI Day Seoul)’의 부대행사로 진행됐다. 이 프로그램 무대에는 국내 스타트업 다섯 팀이 올랐고, 벤처캐피털(VC)과 정책 관계자들이 함께 자리했다. 특히 이들 5개사는 국내 엔비디아 인셉션 회원사 가운데 내부 심사를 거쳐 선발된 팀들이다.
이번 엔비디아 인셉션 리셉션에 참여한 다섯 팀의 역할은 피지컬 AI(Physical AI)가 거창한 슬로건이 아닌, 구체적으로 세분화된 영역임을 보여줬다. 이들은 기술과 역할에 따라 두 갈래로 나뉜다. ▲로봇의 몸체, 손, 작업 대상을 다루는 ‘로보틱스 및 피지컬 AI’ ▲동영상 심사, GPU 자원 운영을 맡는 ‘AI 서비스 인프라’ 영역이다.
그러나 참가팀들은 모두 엔비디아 인프라를 발판으로, 한국 산업 현장에서 활동하는 AI·로봇 서비스를 실제 비즈니스로 만들겠다는 지향점을 공유한다. 결국 이번 리셉션은 어떤 플레이어가 어떤 문제를 어떻게 풀겠다고 나서는지를 산업에 보여준 자리였다.
휴머노이드 상용화의 기로, 韓 스타트업의 피지컬 AI '난제 파훼법'
이번 리셉션의 로보틱스 및 피지컬 AI 분야 참가팀들은 당장 들이닥친 산업 현장의 병목(Bottleneck)을 해결하는 데 집중했다. 이는 피지컬 AI 상용화가 개념증명(PoC) 단계를 넘어섰음을 보여주는 방증이다.
“휴머노이드 상용화의 핵심, 가격과 성능의 균형”
휴머노이드 스타트업 에이로봇은 단일 로봇이 여러 공정·과제를 수행하는 세상을 비전으로 제시했다. 엄윤설 대표는 “휴머노이드를 상용화하는 데 가장 중요한 건 결국 가격과 성능의 균형”이라는 발언으로 현실적인 과제를 명확히 했다.
에이로봇은 4세대 휴머노이드 ‘앨리스(ALICE)’ 두 종의 가격 경쟁력을 확보하기 위해 하체용 선형 구동부(Linear Actuator)를 자체 설계했다. 또한 고가 센서 없이 외력 감지 기능을 구현해 비용을 절감했다. 특히 복잡한 비틀기 동작에 의존한 기존 로봇 핸드의 메커니즘을 다른 시각으로 설계해 새로운 효율성을 확보했다. 손가락에 복잡한 관절을 추가하는 대신, 손목의 움직임을 이용해 물체를 조작하는 동작의 유연성을 확보한 것이다.
이 메커니즘을 차용한 자사 9자유도(9DoF) 로봇 핸드는 15개 이상의 구동부를 필요로 하던 기존 복잡한 조작을 대체할 것으로 보인다.
또한 에이로봇은 헤드마운트디스플레이(HMD) 기반의 원격조작(Teleoperation) 방식으로 물 따르기, 물건 집기 등 동작 데이터를 직접 수집했다. 이때 HMD는 머리에 착용하는 시각화 장치로, 사용자에게 가상현실(VR)·증강현실(AR)·혼합현실(MR) 등 환경을 보여주는 기기다. 이처럼 인간이 직접 시연하며 수집한 데이터를 통해, 로봇에게 효율적이고 자연스러운 행동 패턴을 빠르게 이식하도록 했다.
사측은 이렇게 얻은 데이터를 휴머노이드 통합 개발 플랫폼 ‘엔비디아 아이작 그루트 N1.5(NVIDIA Isaac GR00T N1.5)’ 기반 모델에 학습시켜 핵심 행동 모델을 구축했다. 이미 해당 모델을 ‘앨리스 4(ALICE 4)’와 바퀴 기반 이동형 모델 ‘앨리스 M1(ALICE M1)’에 적용해 제조 라인 데모를 성공적으로 마친 바 있다.
엄윤설 대표는 “연말까지 후속 기종 ‘앨리스 M5(ALICE M5)’를 실제 제조 라인에 투입해, 포장·이송 등 반복 공정에서 작업자와 협업할 수 있는지를 검증할 계획”이라며 “이 개념증명(PoC)이 상용화를 향한 구체적인 로드맵의 첫 관문이 될 것”이라고 말했다.
“좋은 3D 데이터가 없으면, 휴머노이드는 자랄 수 없다”
로봇 학습에 필요한 양질의 3차원(3D) 데이터가 부족한 현실은 업계의 고질적인 문제였다. 합성 데이터 플랫폼 ‘트리닉스(Trinix)’를 개발하는 엔닷라이트는 이 문제를 근본적으로 진단했다. 박진영 대표는 “좋은 3D 데이터가 없어서 텔레오퍼레이션에 과도하게 의존하는 구조”라고 지적했다. 즉, 사람이 직접 로봇을 조종해 데이터를 모으는 비효율적이고 시간 소모적인 구조에서 탈피해야 한다는 인사이트를 제시한 것이다.
엔닷라이트는 이 문제를 해결하기 위해 3D 기반 컴퓨터지원설계(CAD) 파일을 활용한다. CAD 데이터를 토대로 한 ‘트리닉스’를 해법으로 건넨다. 이는 물체의 속성, 관절 구조를 포함하는 구조화·관절화(Articulated) 데이터를 자동으로 생성하는 솔루션이다.
이 접근법은 사람이 직접 데이터를 모으는 텔레오퍼레이션 기반 학습 대비 최대 80% 수준의 시간과 비용 절감을 목표로 한다. 또한 평균 1시간당 약 2000개의 3D CAD 데이터를 자동 생성하고, 각 물체별로 수천 개의 파생 데이터를 더해 방대한 합성 데이터 세트를 구축하는 것이 특징이다.
박 대표는 궁극적으로 “휴머노이드와 산업용 로봇이 만질 수 있는 거의 모든 물체의 디지털 카탈로그를 구축하겠다”는 목표를 밝혔다. 이는 로봇이 실세계를 이해하고 작업하는 데 필요한 데이터 인프라 자체를 혁신해, AI 공장(AI Factory)의 기반을 다지겠다는 의지를 보여준다.
“사람 손의 손재주를 휴머노이드 손으로”
로봇 파운데이션 모델(RFM) 기술 업체 리얼월드는 휴머노이드 상용화의 최종 관문 중 하나인 ‘손 조작 능력’에 집중했다. 회사는 휴머노이드 손 전용 파운데이션 모델 ‘리얼덱스(RLDX)’를 중심으로, 사람 손의 손재주를 로봇 핸드에 그대로 옮기는 것을 목표로 한다. 류중희 대표는 지금이 휴머노이드 시대라고 말하지만 실제로 사람 손 수준의 손재주를 가진 로봇을 구현하는 데에는 갈길이 멀다고 난제를 짚었다. 그러면서 병 따기나 서랍 열고 닫기 같은 ‘능숙하면서 정교한 손 조작(Dexterous Manipulation)’의 중요성을 강조했다.
사측은 장갑과 VR을 활용한 텔레오퍼레이션과 멀티 카메라, 센서를 융합한 독자적인 데이터 수집 시스템을 해결책으로 제시했다. 이 파이프라인은 사람 손의 움직임, 힘(Force), 토크(Torque) 등 정보를 시계열 데이터로 정밀하게 기록한다.
이렇게 수집된 시계열 데이터는 로봇 시뮬레이션 플랫폼 ‘엔비디아 아이작 심(NVIDIA Isaac Sim)’과 강화학습(Reinforcement Learning) 프레임워크 ‘엔비디아 아이작 랩(NVIDIA Isaac Lab)’ 등을 토대로 한 시뮬레이션 환경에 투입된다. 이 가상 환경에서 모델은 사전 학습(Pre-training)과 강화학습 과정을 거쳐 로봇 핸드의 행동 모델을 최적화한다.
리얼월드의 이러한 전략은 고자유도 로봇 핸드 전용 파운데이션 모델로 이 지능을 다듬어 향후 다양한 휴머노이드 플랫폼에 이식하는 것이 목표다.
류 대표는 “전 세계 인구구조 변화로 휴머노이드 수요가 빠르게 늘고 있는 시장을 중심으로, 실제 프로젝트를 수행하며 매출과 데이터라는 핵심 요소를 함께 축적하고 있다”는 점을 강조했다. 그러면서 “미래의 휴머노이드 플랫폼에 이식 가능한 핵심 지능 계층(Intelligence Layer)을 지속 구축해나갈 것”이라고 비전을 내세웠다.
AI 서비스의 안정성과 GPU 인프라 운영 문제의 해법
로봇 하드웨어와 데이터 이슈를 넘어, AI 서비스 그 자체의 안정성과 이를 구동하는 GPU 인프라의 효율화 역시 중요한 의제로 다뤄졌다.
“프롬프트 한 줄로 만든 영상, 누가 대신 걸러줄 것인가”
AI 기반 영상 검증 및 브랜드 세이프티 솔루션 업체 파일러는 이번 챌린지 최종 우승팀으로 선정되며 생성형 콘텐츠(AIGC) 시대의 새로운 위험에 대응하는 기술의 중요성을 입증했다. 이들이 다루는 핵심 문제는 동영상 콘텐츠의 양이 폭발적으로 증가하면서 생기는 검증 인력의 한계다. 다시 말해 딥페이크, 유해 영상 등을 자동 검수·차단하는 AI 기반 기술을 제안하는 것이다.
이러한 기조로 탄생한 주력 서비스는 동영상 속 유해 요소를 자동으로 검수하는 멀티모달(Multimodal) 기반 비디오 심사 솔루션 ‘에이드(AiD)’다. 오재호 대표는 “프롬프트 한 줄로 비디오가 생성되는 시대에, 사람이 일일이 영상을 검수하는 방식은 이미 한계를 넘었다”는 냉철한 시각을 내보였다.
이를 타파하기 위해 파일러는 세 가지 핵심 기술을 접목했다. 자체 비디오 임베딩 모델을 통해 영상의 내용을 AI가 분석 가능한 고유의 디지털 정보 형태로 변환한다. 이어서 벡터 검색 기술로 변환된 앞선 디지털 정보와 기존 위험 데이터 간의 유사도를 비교해 위험 요소를 탐지한다. 최종적으로 멀티모달 필터링 기술로 시각 정보 외에 오디오·텍스트 등 다양한 양식(Modality)을 통합 분석해 정확하고 맥락적인 검증을 수행한다.
오재호 대표는 이 같은 파일러의 가치를 ‘설명 가능한 AI(Explainable AI)’에 있다고 봤다. 그는 생성형 AI(Generative AI) 애플리케이션을 위한 안전벨트를 만드는 회사라고 비유하며, “어떤 영상이 어떤 이유로 위험한지를 명확하게 제시하는 것이 미래 검증 레이어의 핵심 가치”라고 설파했다. 이러한 관점을 바탕으로, AIGC가 확산할수록 이 안전성 확보 레이어의 중요성은 기하급수적으로 커질 수밖에 없다는 점 또한 강조했다.
끝으로 그는 “엔비디아 인프라 위에서 세계 최고 수준의 영상 이해 AI를 고도화할 계획”이라며 “글로벌 서비스들이 안심하고 쓸 수 있는 신뢰 기반 레이어를 만들어 가겠다”고 우승 소감을 말했다.
“GPU는 샀다, 이제는 ‘잘 돌리는 일’만 남았다”
AI 인프라 운영 솔루션 업체 베슬AI는 ‘한국형 AI 인프라’를 표방하며 AI 도입의 현실적인 병목 지점을 파고들었다. GPU를 사놓고도 제대로 활용하지 못하는 사용자들의 고민에서 출발한 것이다. 그동안 많은 기업과 연구기관이 온프레미스(On-premise)·클라우드 환경에서 GPU 서버를 운용했지만, 정작 학습·추론을 어떻게 실행·관리할지에서 막히는 경우가 많은 현상을 근본적 문제로 진단했기 때문이다.
이러한 과제는 기업들이 고가의 GPU를 구축했음에도 불구하고, 인프라 관리 문제 때문에 AI 개발 속도가 저해되는 현실을 짚어낸 것이다. 안재환 대표의 파훼법은 파편화된 GPU 자원을 단일 플랫폼으로 통합하는 자사 컴퓨팅 게이트웨이 방법론이다. 그에 따르면, 기업·연구기관 등은 이 게이트웨이를 통해 멀티 클라우드 환경에 흩어진 GPU 클러스터를 마치 단일 자원처럼 통합해 쓸 수 있다.
그 위에서는 머신러닝운영(MLOps), 거대언어모델운영(LLMOps), 에이전트 운영 등 도구를 통해 학습·배포·모니터링을 자동화하도록 설계했다. GPU 자원 자체는 클라우드에서 가져오지만, 그 위에 이 자원을 가장 효율적으로 사용하고 관리할 수 있는 운영 자동화 시스템을 베슬AI가 설계했다는 의미다.
주력 플랫폼 ‘베슬(VESSL)’은 이런 환경을 정리해 주는 역할을 맡는다. 아마존웹서비스(AWS)·구글클라우드 등 글로벌 클라우드와 네이버클라우드, 국가 AI 컴퓨팅 센터 등에 흩어져 있는 GPU 자원을 하나의 창구에서 바라보고 할당할 수 있게 해주는 일종의 ‘컴퓨팅 게이트웨이’다.
실제로 국내 대학과 연구소에서는 베슬AI 플랫폼을 통해 GPU 인프라 운영팀 없이도 연구자가 웹에서 바로 GPU를 할당받고 실험을 시작하는 효율성을 확보하고 있다.
안재환 대표는 이러한 효율성을 바탕으로 최종 목표를 제시했다. 그는 “결국 컴퓨팅을 쓰는 대부분의 워크로드가 이런 플랫폼을 거쳐가게 만드는 것”이라며 “AI 인프라 운영 표준을 만들겠다”며 메시지를 전달했다.
엔비디아가 본 ‘한국형 피지컬 AI’와 최종 메시지
엔비디아 입장에서 이들은 단순한 고객이 아니라, ‘AI 공장’과 ‘소버린 AI(Sovereign AI)’라는 거시 담론을 실제로 다양한 현장에 이식하는 실행자들이다. 이 관점에서 지금 한국이 피지컬 AI에서 어디까지 와 있는지를 압축해 보여준 단면을 제시한 주체들로 풀이된다.
이러한 개별 실행자들을 아우르는 행사의 궁극적인 메시지는 엔비디아와 중소벤처기업부의 협력 구상에서 출발한다. 양측은 엔비디아가 개발한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델 ‘CUDA(Compute Unified Device Architecture)’ 이후 20년 넘게 쌓인 GPU·네트워크·소프트웨어 자산이 이제 AI 팩토리라는 개념으로 수렴한다는 점을 강조했다. 이 가운데 한국이 그 위에서 실제 제품과 서비스를 만들어낼 거점 가운데 하나라는 큰 그림을 제시한 점이 주목 포인트다.
인셉션 프로그램은 이러한 혁신 팀을 발굴해 GPU 크레딧과 기술 지원을 제공하고, 다양한 프로그램을 통한 성장 경로를 열어주는 통로 역할을 한다. 관계자는 “엔비디아와의 협력을 통해 정부가 여는 글로벌 무대에 한국 AI 스타트업이 더 자주 서게 하는 것을 목표로 삼고 있다”고 언급했다.
정부는 내년에도 리셉션과 ‘엔업(N-Up)’ 프로그램 연계를 확대하겠다고 예고하며 지향점을 분명히 했다. 엔업 프로그램은 리셉션 프로그램에 참여하는 한국 기업들 가운데 우수 기업을 선발해, 더 깊고 맞춤화된 지원을 제공하는 심화 단계 프로그램이다.
이와 관련해 이번에 우승한 파일러의 사례는 엔비디아의 워크로드 방향성과 일치함을 입증한 것으로 평가받는다. 이번 선정은 솔루션을 이미 상용 서비스 단계까지 끌어올린 역량을 높이 산 결과로 분석된다. 엔비디아의 소버린 AI 비전에 따른 ‘콘텐츠 안전 레이어’를 제시했다는 점이 기술력·시장성을 동시에 인정받은 이유로 해석할 수 있다.
헬로티 최재규 기자 |





