"자, 피지컬 AI 이야기를 해보죠(OK, let’s talk about physical AI)"
“범용 로보틱스의 챗GPT급 전환이 코앞입니다
(The ChatGPT moment for general robotics is just around the corner)"
2025년 1월 6일(현지시간) 미국 라스베이거스에서 열린 국제전자제품박람회(CES 2025) 키노트에서 젠슨 황(Jensen Huang) 엔비디아 최고경영책임자(CEO)가 연단에 올라섰다. 그는 이 자리에서 ‘피지컬 AI(Physical AI)’를 로봇·자율주행처럼 현실에서 움직이는 인공지능(AI)의 다음 단계로 제시했다.
같은 자리에서 엔비디아는 로봇과 자율주행 분야 학습(Learning)·훈련(Teaching)을 겨냥한 플랫폼을 공개했다. 해당 발표는 AI가 텍스트·이미지 등을 다루던 기존 기능에서 '물리 법칙이 작용하는 현실 세계의 동작과 변화'를 모델링하고 예측하기 위한 기반으로 관심받았다. 이때 사측의 주요 메시지는 ‘피지컬 AI가 더 이상 연구실 언어에 머물지 않을 것’을 시사한 점이다.
이 메시지가 CES에서 특히 크게 조명된 배경이 있다. 젠슨 황은 키노트에서 AI의 흐름을 인식형 AI(Perception AI), 생성형 AI(Generative AI), 피지컬 AI로 단계화해 ‘이제 피지컬 AI의 시대’라고 못 박았다. 앞서 그는 지난해 ‘GPU 기술 콘퍼런스(GTC)’와 ‘컴퓨텍스(COMPUTEX)’에서도 피지컬 AI를 언급했지만, CES 2025에선 이를 키노트의 핵심 서사로 전면에 올리며 ‘피지컬 AI’ 확산의 기점을 만들었다.
그 이후 1년, 피지컬 AI는 유행어에서 업계의 공통어로 자리 잡았다. 그 배경을 데이터 확보와 검증, 현장 배치, 지속 운영의 관점에서 정리했다. 실제 도입이 경제성, 가동 안정성, 안전성 등 운영 조건에서 어떻게 갈릴까?
‘신기술’ 등장 아닌, 로봇 실현을 위한 ‘공통 언어’의 탄생
피지컬 AI 담론이 올해 유독 빠르게 확산된 배경은 특정 신기술의 돌발적 출현에 있지 않다. 오히려 업계가 오랜 기간 개별적으로 다뤄온 난제들을 하나의 단어로 통합해 정의하기 시작했기 때문이다.
로봇·자율주행 등 물리적 현실 세계에서 구동되는 AI는 단순히 모델의 성능 수치만으로 가치가 결정되지 않는다. 데이터 출처, 검증 방식, 현장 적용 공정, 도입 이후의 유지·개선 체계 등 과정이 톱니바퀴처럼 빈틈없이 맞물린 하나의 시스템으로 작동해야 한다. 업계는 이 복잡한 전체 과정을 매번 설명해야 하는 번거로움을 해소하기 위해 ‘피지컬 AI’라는 명칭을 하나의 합의된 기술 방법론으로 채택했다.
이 용어가 공통어로 자리 잡으면서 어젠다의 본질적인 초점도 전환됐다. 과거에는 ‘데모 구현이 가능한가’에 집중했다면, 이제는 ‘실제 운영이 가능한가’로 이동했다. ▲예외 상황에서의 작동 지속성 ▲사용자와의 공유 공간 내 안전 담보 ▲운영기술(OT)·정보기술(IT) 융합 시 병목 구간 파악 ▲현장 데이터를 지능으로 전환하는 선순환 학습 체계 등이 핵심 의제로 부상했다.
즉, 피지컬 AI는 로봇 도입을 실전에서 구현하려는 이들이 사용하는 ‘운영 언어’로 해석할 수 있다.
실제로 글로벌 경영 컨설팅 업체 딜로이트(Deloitte)는 보고서에서 이러한 운영 중심의 투자 가속화 흐름을 제시했다. 전미제조업협회(NAM)의 설문을 인용한 ‘2024년 제조 산업 전망 보고서(2024 Manufacturing Industry Outlook)’에는 글로벌 제조 기업의 70% 이상이 인력난 해소를 위해 기술 도입을 최우선 과제로 꼽고 있다는 데이터가 담겼다. 구체적으로 제조업 경영진의 4분의 3가량이 차세대 기술 인재 확보·유지를 최우선 경영 과제로 꼽았다는 분석이다.
이러한 공통어의 확산 이면에는 플랫폼, 생태계, 도입 시나리오라는 실체가 동반다는 점이 주효했다. 일례로 젠슨 황이 ‘피지컬 AI를 논의하자’고 화두를 던진 직후, 물리 세계 시스템을 겨냥한 플랫폼을 연결해 설명한 사례가 이를 뒷받침한다.
이는 구체적으로는 실제 로봇이 현장에 투입되기 전, 가상 세계에서 수만 번의 시뮬레이션을 거쳐 안전과 효율을 미리 검증할 수 있는 접근법이다. 젠슨 황은 현실의 물리 법칙을 이해하는 지능인 ‘월드 파운데이션 모델(WFM)’을 핵심 엔진으로 내세웠다.
그러면서 WFM 개발 플랫폼으로 ‘엔비디아 코스모스(NVIDIA Cosmos)’를 공개하며 피지컬 AI의 실체를 구체화했다. 이 플랫폼은 물리적 상호작용을 이해하고 예측하는 ‘물리 법칙 인지형(Physics-aware)’ 모델군을 핵심으로 한다. 핵심은 실제 데이터를 무한정 모으는 대신에 합성 데이터, 시뮬레이션, 학습을 통합 워크플로로 연결해 로봇·자율주행의 파이프라인을 구성하겠다는 전략이다. 이는 추상적인 개념에 머물던 피지컬 AI가 산업 현장에서 어떻게 구현되는지를 증명하는 사례로 평가받았다.
로봇 분야에서 피지컬 AI가 주류가 된 이유 "'언어’ 넘어 ‘행동’이 핵심 지표"
로봇 공학에서 AI의 결과물은 ‘적절한 답변’이 아닌 ‘올바른 행동’이어야 한다. 로봇 업계가 피지컬 AI에 민감하게 반응하는 이유도 여기에 있다.
생성형 AI가 오피스 환경에서 텍스트 결과물로 임무를 완수한다면, 로봇은 그 과정에 힘·속도·접촉·안전이라는 물리적 변수가 필연적으로 수반된다. 전문가들은 이러한 특성 때문에 피지컬 AI의 성공 여부가 다음의 두 가지 핵심 역량에 달려 있다고 분석한다.
로봇은 예측하기 어려운 돌발 변수가 많은 '롱테일(Long-tail)' 환경에서 단 한 번의 실수만으로도 막대한 사고 비용을 초래할 수 있다는 점이 첫 번째다. 이어 로봇 지능의 핵심인 현실 데이터는 수집 과정이 느리고 위험하며 큰 비용이 든다는 점도 뒤따른다. 이에 전문가 그룹은 이 두 가지 실존적 난제를 해결하기 위해 피지컬 AI라는 담론이 업계의 공통어로 굳어졌다고 분석한다.
지난 1년간 이러한 흐름은 ‘로봇 전용 모델’이라는 개념을 구체화했다. 과거 알파고(AlphaGo)로 전 세계를 놀라게 했던 구글(Google)의 AI 조직 딥마인드(DeepMind)는 화면 속에만 머물던 AI의 지능을 로봇에 이식해, 실제 현실에서 행동하게 만드는 체계를 전면에 내세웠다.
그 구체적인 결과물이 바로 최근 각광받는 ‘비전·언어·행동(Vision-Language-Action 이하 VLA)’ 모델이다. VLA 모델은 로봇이 보고(Vision), 이해하고(Language), 직접 움직이는(Action) 과정을 통합한 기술이다. 딥마인드가 이 모델을 통해 로봇 제어의 새로운 표준을 제시하자, 오픈 생태계에서도 관련 논문과 성능 지표가 쏟아져 나오며 피지컬 AI를 향한 기술 축적에 속도가 붙고 있다.


▲ 딥마인드의 VLA 모델 'RT-2'는 웹 지식, 로봇 데이터를 결합해 로봇 제어로 연결한 대표 사례로 인식된다. (출처 : 딥마인드, 편집 : 헬로티 최재규 기자)
스타트업 진영의 행보는 더욱 공격적이다. 이들은 ‘범용 로봇 뇌’를 표방하며 로봇의 형태와 무관하게 작동하는 파운데이션 모델을 지향한다. 이를 어떤 하드웨어에도 이식 가능한 로봇 지능으로 정의하며 시장을 설득하고 있다.
미국 로봇 스타트업 피규어AI(Figure AI)가 선보인 2세대 휴머노이드 로봇(Humanoid Robot) ‘피규어 02(Figure 02)’이 대표적이다. 피규어 02는 AI가 물리적 실체와 결합해 실제 산업 현장에서 어디까지 정교해질 수 있는지를 구현한 사례다. 그동안 로봇의 한계로 여겨졌던 정밀 조립 영역까지 지능의 범위를 넓힌 점이 주목 포인트였다.
이처럼 로봇 업계가 피지컬 AI에 사활을 거는 이유는 더 이상 ‘말 잘하는 AI’가 차별점을 주지 못하기 때문이다. 이제 경쟁의 본질은 복잡한 물리 법칙이 지배하는 현실 세계에서 '로봇을 얼마나 경제적이고 안정적으로 구동할 수 있느냐'는 방법론 싸움으로 옮겨간 모습이다.
‘데모’의 시대는 갔다...급부상한 ‘배치(Deployment)’의 문제
피지컬 AI가 올해 어젠다의 중심에 선 결정적 이유는 업계가 직면한 공통의 장애물 때문이다. 기술적 시연은 언제나 가능했지만, 실제 현장 배치(Deployment)는 차원이 다른 문제다. 실제 현장에는 반복 동작 외에도 수많은 예외 상황이 발생하며, 이러한 예외가 누적될수록 인력 투입과 비용 부담은 가중된다.
이에 따라 담론의 무게중심이 모델 성능에서 운영 안정성으로 이동했고, 피지컬 AI는 이 변화를 설명하기에 가장 최적화된 용어로 평가받는다.
실제 제조·물류 현장에서는 이미 시험 사례들이 축적되고 있다. 제조 분야에서는 ‘시범(Pilot) 도입 후 반복 적용’의 방향성이 마련된 모습이다. 독일 자동차 제조사 BMW는 미국 사우스캐롤라이나주 스파턴버그 소재 공장에서 피규어AI의 휴머노이드를 시범 적용 형태로 시험하고 있다. 이를 통해 로봇이 반복 업무를 맡고 사람은 고부가 작업으로 이동하는 운영 시나리오를 검증하고 있다.
경쟁사인 메르세데스-벤츠 역시 미국 로봇 스타트업 앱트로닉(Apptronik)과의 협업을 통해 인간 작업자를 보조하는 휴머노이드 로봇 적용 가능성을 테스트하는 방향을 공개적으로 밝혔다. 휴머노이드 로봇 ‘아폴로(Apollo)’를 투입해 부품 전달, 검수 등 단순 반복 업무의 자동화를 테스트하고 있다.


▲ BMW 생산 현장에서 검증 과정 중인 피규어AI '피규어 02'(좌)와 벤츠 공장에서 도입 가능성을 점치는 '아폴로'. (출처 : BMW그룹, 벤츠, 편집 : 헬로티 최재규 기자)
여기에 현대자동차그룹 또한 인수한 보스턴다이내믹스(Boston Dynamics)의 전기 모터 방식의 차세대 휴머노이드 ‘아틀라스(Atlas)’를 현장에 배치해 시험할 것을 공식화했다. 이처럼 글로벌 제조 업계는 휴머노이드의 실질적인 상용화 전략을 현실화하고 있다.
물류 분야에서는 미국 로봇 스타트업 어질리티로보틱스(Agility Robotics)의 휴머노이드 로봇 ‘디지트(Digit)’가 글로벌 물류 업체 GXO와 같은 상용 물류 운영 환경에서 작업을 수행하는 모습을 연출하고 있다.
특히 디지트는 실제 운영 환경에서 누적 10만 개 이상의 운반 상자(Tote) 이동을 성공적으로 완수하며 그 안정성을 입증했다. 이는 로봇의 ‘수행 가능성’을 보여주는 단계에서 어떤 업무 단위에서 운용 가능한지를 증명하는 단계로의 진입을 의미한다.
이러한 사례들이 상징적인 이유는 로봇이 시연 단계를 넘어서는 순간이 다가오고 있다는 것을 시사하기 때문이다. 사용자는 현장에 로봇이 투입하는 순간, 더 이상 기술적 화려함을 중요하게 생각하지 않는다.
대신 데이터 수집의 체계성, 실패율을 낮출 실질적 방안, 사고 시 검증 책임 소재, 지속 가능한 유지보수 주체 등과 같은 현실적인 운영 시스템에 대해 고민하기 시작했다. 결국 지금의 변화는 로봇이 ‘할 수 있는 일’을 보여주는 단계를 지나, 실제 산업 현장에서 ‘어떻게 책임지고 가동할 것인가’라는 운영 최적화의 영역으로 진입했음을 의미한다.
2026년, 피지컬 AI의 성패 가를 변수는?
이같이 피지컬 AI가 산업 전반의 공통어로 자리 잡으면서, 관련 업계는 로봇 도입 이후의 실질적인 변화 지점을 구체화하고 있다. 향후 피지컬 AI 경쟁은 실제 현장에서 '저비용·장기·안전 운용'을 가능케 하는 최적화 조건 경쟁으로 전환될 전망이다.
특히 전문가들은 고가의 휴머노이드 로봇을 산업 현장에 대량 보급하기 위해서는 다양한 요소가 필요하다고 제언한다. ▲전력 효율을 극대화한 저전력 구동 기술 ▲부품 내구성을 바탕으로 한 장기 가동 안정성 ▲작업자와의 충돌을 완벽히 방지하는 실시간 안전 제어 시스템 확보 등이 이에 해당한다.
피지컬 AI의 폭발적인 시장성 또한 이러한 산업적 변화를 뒷받침한다. 시장조사기관 서비콘컨설팅(Cervicorn Consulting)에 따르면, 피지컬 AI 시장은 지난 2024년 37억8000만 달러(약 5조5000억 원)에서 오는 2034년 최대 685억 달러(약 100조 원) 규모로 급성장할 것으로 관측했다. 특히 올해부터 2034년까지의 연평균 성장률(CAGR)을 30%대로 제시하며 강력한 성장 모멘텀을 예고했다. 이러한 낙관적 전망은 다른 기관에서도 일관되게 나타난다.
프레시던스리서치(Precedence Research) 역시 해당 시장이 올해 54억1000만 달러(약 7조8000억 원)에서 2034년 611억9000만 달러(약 90조 원)르로 확대되며, CAGR 31%대의 높은 성장세를 기록할 것으로 분석했다.
다만 이러한 예측은 피지컬 AI를 어느 영역까지 포함하느냐에 따라 숫자는 달라질 수 있다. 로봇, 자율주행, 산업용 에이전트, 시뮬레이션·합성데이터 플랫폼 등이 이에 해당한다. 여기서의 포인트는 기업들이 이 시장을 기존 ‘연구개발 경쟁’이 아니라 ‘배치 이후 운영 수익의 경쟁’으로 보고 있다는 점이다.
결국 천문학적 규모의 시장이라는 표현은 로봇 산업의 본질이 변화했음을 알리는 신호로 해석된다. 이제 업계의 승패는 단순한 ‘지능’ 경쟁에서 멈추지 않는다. 실제 현장 배치 이후에도 수익 모델이 성립하는 ‘경제성’, 중단 없는 가동을 보장하는 ‘운영 안정성’, 엄격한 책임과 규제를 통과할 수 있는 ‘안전 및 검증 체계’를 누가 먼저 입증하느냐에 달렸다.
우선 비용의 무게중심이 학습에서 운영으로 이동할 것으로 보인다. 업계는 다수의 기업이 시범 도입 단계에서는 성공하고도 실제 확산 과정에서 좌초하는 이유에 대해 지적했다. 예외 상황 발생 시의 가동 중단과 인적 개입에 따른 비용 상승 때문이라는 것이다. 결국 도입 기업 입장에서는 유지보수를 포함한 총소유비용(TCO) 관점의 투자수익률(ROI) 확보가 로봇 배치의 최종 결정 요인이 될 것이라는 분석이다.
동시에 실질적인 승부처는 데이터 파이프라인 구축에 있다는 목소리도 나온다. 현장의 모든 데이터를 실물로 학습시키는 방식은 한계가 명확하다는 것이 이에 대한 전제다. 합성 데이터, 시뮬레이션, 현장 재학습(On-site Retraining) 등을 최적의 비율로 결합한 학습 루프가 필수적이라는 뜻이다. 이 시스템이 구축돼야만 초기 단순 작업에서 시작해 점진적으로 업무 범위를 확장하는 선순환이 가능해질 전망이다.
마지막으로 검증·안전이 강력한 진입 장벽으로 부상한다는 시각이다. 로봇은 인간과 공존하는 시스템이라는 구조상 규제, 보험, 산재 리스크에서 자유로울 수 없기 때문이다. 여기서 핵심은 모델이 ‘검증 가능한 형태로 성능·안전을 입증할 수 있는가’로 귀결된다. 이를 충족하지 못하는 기술은 영원히 시범 운영 단계에 머물 수밖에 없다.
결론적으로 피지컬 AI는 로봇 도입의 병목 현상을 타개하기 위한 ‘로봇 운영의 언어’이자 ‘생태계 생존 전략’이다. 화려한 가동 시연의 막이 내리고 냉혹한 실전 배치의 막이 오른 지금, 실무적 기반을 갖춘 기업만이 90조 원 규모의 천문학적 시장을 점유하게 될 것이다.
2026년, 피지컬 AI는 실험실의 청사진을 벗어나 직접 산업을 가동하는 가장 강력한 ‘실전형 엔진’으로 거듭날 준비를 마쳤다.
헬로티 최재규 기자 |












































