사람 곁에 놓인 로봇은 ‘형태 최적화’에 앞서 ‘행동 구현’을 증명해야 한다. 개별 기능을 더 늘리는 것보다, 사람·에이전트(Agent)·로봇이 함께 움직이는 전체 작업 흐름(Work Flow)을 설계하는 것이 더 큰 성과를 만든다는 진단이 나온다.
문제는 여기서부터다. 로봇 기체의 한계는 데이터 순환 체계의 단절에서 드러난다는 시각인데. 학습 데이터가 물리적 움직임으로 무결하게 치환되는 과정, 인간과의 협업 중 발생하는 변수 제어 능력 등이 시장 안착의 기준으로 떠오르는 배경이다. 인지·판단·구동·환류로 이어지는 연쇄 작용이 하나의 루프로 동기화되지 않는다면, 현장 운영 단계로의 전환은 먼 미래가 될 수 있다는 얘기다.
“이제는 언어·지각·행동을 통합해 세계를 더 인지적·개념적으로 추론하는 지능형 기계와 함께 일할 수 있다
(It is now possible to work with intelligent machines that integrate language, perception, and action to reason in more cognitive and conceptual ways about the world)”
- 다니엘라 루스(Daniela Rus) 매사추세츠공대(MIT) 컴퓨터과학·인공지능연구소(CSAIL) 소장 -
글로벌 컨설팅 업체 맥킨지앤컴퍼니(McKinsey & Company)는 최근 보고서를 통해 산업·공장 자동화(FA)의 정량적 성과 차이가 ‘개별 공정 자동화’가 아닌 ‘전체 워크플로 재설계’에서 기인한다고 분석했다. 사람, 인공지능 에이전트(AI Agent), 로봇이 인지·판단·실행의 전체 아키텍처를 유기적으로 재구성해야 한다는 의미다.
글로벌 로봇 산업의 경쟁력 역시 같은 맥락에서 갈린다. 돌발적인 예외 상황(Edge Case)과 인간의 개입 속에서 기체가 어떤 프로세스로 구동될지 그 연쇄 반응의 완성도를 먼저 확보해야 한다는 지적이다.
젠슨 황(Jensen Huang) 엔비디아(NVIDIA) 최고경영책임자(CEO) 역시 가상 검증 아키텍처의 중요성을 강조하며 맥을 같이했다. 산업용 로보틱스가 인공지능(AI) 중심으로 고도화될수록 실제 현장 배치 이전 단계에서 설계·테스트·최적화를 수행하는 고정밀 가상 시뮬레이션 인프라가 필수적이라는 진단이다.
그는 로보틱스 생태계의 전제 조건으로 AI 모델, 연산 컴퓨팅, 소프트웨어 프레임워크가 통합 플랫폼 안에서 유기 동기화되는 ‘풀스택(Full-stack)’ 아키텍처를 제시했다. 물리적 현장 배치 이후 오차를 수정하는 접근으로는 비정형 상황이 지속 나타나는 현장의 지연·충돌·변수를 감당할 수 없다는 연산 효율성의 판단이 깔려 있다.
결국 피지컬 AI(Physical AI)의 핵심 과제는 현실 세계 내 기능이 어떤 논리적 순서로 구동되고 제어 안정성을 유지하느냐로 이어진다. 기체 설계 고도화 이후 맞닥뜨리는 엔지니어링의 본질도 이와 결을 함께한다. 현장에서 수집한 데이터를 어떤 구조로 학습·정제하고, 그 추론 결과를 실제 역학적 동작으로 어떻게 구현할 것인가. 로봇 행동 지능은 이 고도화된 연쇄 구동 체계의 설계 역량에 달려 있다.
두 번째 문제는 실행 체계다. 피지컬 AI의 병목은 모델 크기보다, 그 판단을 물리 시스템 안에서 얼마나 제때 일관된 품질로 실행하느냐에 따라 해결 가능성이 점쳐진다. 양부호 모벤시스 의장은 이를 시뮬레이션과 실환경 간 간극, 즉 ‘시뮬레이션·실환경 간 격차(Sim2Real Gap)’의 문제로 짚었다.
가상 환경에서 매끄럽던 동작이 현실에서 그대로 구현되지 않는 이유에 대해, 제어 체계가 감당하지 못하는 ‘미세 오차의 누적’에서 찾은 것이다.
이 문제의 출발점은 지연(Latency)이다. 실제 고속·고정밀 공정에서는 0.1초 수준의 지연이나 1mm 안팎의 궤적 오차도 여러 문제를 야기할 수 있다. 충돌 회피 실패, 정밀도 저하, 라인 정지 등이 발생한다는 뜻. 여기에 ▲물리 모델 오차 ▲센서 신호 교란 ▲데이터 왜곡 ▲통신 지연 ▲제어 주기 불일치 ▲운영체제(OS) 일정 관리 간섭 등이 겹치면 가상 환경에서 맞던 궤적은 현실에서 쉽게 무너진다.


▲ 시뮬레이션 환경과 실상황 간 간섭·지연 최소화가 업계에서 주목받고 있다. (촬영·편집 : 헬로티 최재규 기자)
결국 AI의 판단 능력보다 먼저 검증돼야 할 것은 데이터를 받아들이고, 보정하고, 실행으로 구현하는 ‘시간의 질서’가 중요하다는 의견이다.
이 같은 가상·현실 격차는 AI·구동부(Actuator) 간 '시간 단위 차이'로 인해 더 벌어진다. 고도의 판단을 수행하는 AI 모델의 연산 주기가 통상 100~500밀리초(ms) 수준이라면, 로봇 관절이 진동 없이 움직이기 위한 모션 제어 주기는 0.5~1밀리초(ms) 단위를 요구한다. ‘인지·추론 속도’와 ‘로봇 가동 속도’가 애초에 다른 기술 체계에서 가동한다는 뜻이다.
“로봇용 AI가 사람에게 유용하고 도움이 되려면, 일반성·상호작용성·손재주를 갖춰야 한다
(To be useful and helpful to people, AI models for robotics need three principal qualities. they have to be general, interactive and dexterous)”
- 캐롤라이나 파라다(Carolina Parada) 구글 딥마인드(Google Deepmind) 로보틱스 총괄 -
셋째 병목은 데이터다. 웹(Web) 규모 지식이 곧바로 로봇 행동으로 이어지지 않는다는 점이 여기서 드러난다. 구글(Google)의 AI 조직 '딥마인드(DeepMind)'가 개발한 시각·언어·행동(VLA) 모델 ‘RT-2(Robotics Transformer 2)’이 그 예다. 딥마인드는 RT-2를 소개하며, 웹·로봇 데이터를 결합해 일반화된 행동으로 잇는 구조를 제시했다.
비전·언어(VL) 모델이 웹에서 익힌 개념 이해를 그대로 물리 행동으로 옮길 수 없고, 실제 로봇 궤적 데이터가 함께 접목돼야 제어 가능한 행동으로 변환된다는 이해에서 비롯된 메커니즘이다.
AI의 판단력과 로봇의 구동력 사이의 이러한 격차는 서비스 로봇 분야에서 더 크게 벌어진다. 통제된 환경에서 정해진 동작만 하는 산업용 로봇과 달리, 서비스 로봇은 예측 불가능한 비정형 공간에서 활동하기 때문이다.
웹에는 손으로 물체를 집고 놓는 장면은 많지만 관절 각도, 힘, 속도, 접촉 순간, 미세 조정, 실패 뒤 복구 과정까지 담긴 데이터는 많지 않다. RT-2가 웹 데이터로 일반화 성능을 넓히면서도 로봇 데이터와의 결합을 전제로 삼은 배경도 여기에 있다.
알렉스 구(Alex Gu) 푸리에로보틱스(Fourier Robotics) CEO도 휴머노이드 로봇(Humanoid Robot) 개발 과정에서의 과제를 같은 흐름에서 짚었다. 그는 “휴머노이드 개발은 엄청난 양의 실제 데이터를 요구한다”고 말했다. 그러면서 “실제 세계에서 힘들게 수집한 데이터를 바탕으로 모델 개발 워크플로를 가속해야 한다”고 부연했다. 서비스 로봇은 현장에서 반복 확보한 실데이터의 밀도·품질에 따라 기술력이 차이난다는 뜻이다.
로봇이 ‘실데이터’에 집착하는 배경...'진짜 데이터 캐내기 돌입한' 업계
국내 AI 기반 서비스 로봇 기술 업체 엑스와이지는 이 같은 글로벌 난제를 돌파하는 데 집중하고 있다. 자사 신규 양팔형 휴머노이드 플랫폼 ‘듀스(DEUX)’를 통해 실제 현장에서 구동 가능한 데이터 파이프라인을 실증한다는 전략적 연구개발(R&D) 활동이다.
본질적인 과제는 실질적 ‘행동’의 구현이라는 시각이다. 사람과 공존하는 역학 구조를 확정한 뒤에는 물리 공간에서의 구동 궤적, 예외 상황, 실패 후 재학습 과정을 데이터화하는 공정이 남기 때문이다.
사측에 따르면, 실제로 듀스의 행동 지능은 데이터를 수집·정제하는 아키텍처에 집중해 설계됐다. 인간의 동작에 녹아있는 ‘암묵지’, 즉 상황 판단과 실패 복구 능력을 정교하게 추출하는 과정이 중심이 됐다. 이것이 피지컬 AI(Physical AI) 지능화의 본질적인 출발점이라는 회사 철학에 의한 기술 구상이다.
제어, 데이터 수집, 소프트웨어 등을 담당하는 서원호 연구원은 원격 제어(Teleoperation)를 듀스 파이프라인의 초입이자 핵심 단계로 규정했다. 사람의 행동 양식에는 고도의 판단 프로세스가 녹아있기 때문에, 로봇이 스스로 학습하기 전 그 사고의 흔적을 먼저 수집해야 한다는 설명이다.
서 연구원은 “이는 텔레오퍼레이션, 데이터 정제, 모방학습(Imitation Learning), 강화학습(Reinforcement Learning)으로 이어지는 구동 체계”라며 “이 첫 단추가 이후 AI 학습 전체 품질을 좌우한다”고 피력했다. 듀스가 받아들이는 데이터는 사람이 실제 작업을 해결해 나가는 인지적 순서와 맥락이라는 메시지다.
여기서 모방학습은 사람 데이터를 로봇이 복제해 기초 숙련도를 쌓는 단계다. 강화학습은 이를 바탕으로 로봇이 가상·현실 환경에서 시행착오를 겪으며 스스로 최적의 구동 궤적을 찾아 고도화하는 과정을 의미한다.
행동 지능의 출발점은
사람의 동작을 로봇이 따라 배울 수 있는 형태로 바꾸는
‘입력 구조’에 있습니다.
그래서 엑스와이지는 시뮬레이션이나 스크립트 기반의 '합성 데이터(Synthetic Data)'만으로는 부족하다고 봤다. 서원호 연구원은 “가상 환경에서 데이터를 생성하는 합성 데이터를 비롯한 ‘규칙(Rule) 기반 제어’는 접촉 순간의 복잡한 물리 현상이나 돌발적인 예외 상황을 충분히 담아내지 못한다”고 언급했다.
연이어 “반면 사람 행동에는 상황 판단, 실패 복구, 미세 힘 조절 같은 암묵적 지식이 자연스럽게 투영된다”고 부연하며 이해를 도왔다. 로봇이 모방해야 하는 대상은 표면적인 결과 동작이 아니라, 그 결과를 도출하기까지의 판단과 복구 메커니즘이라는 의미다.
이때 이들이 설정한 수집 데이터 기준은 양보다 품질 다시 말해, ‘작업 완결성’과 ‘일관성’이다. 서 연구원에 따르면, 정제되지 않은 데이터 1000건보다 일관성이 높은 무결한 데이터 200건이 학습 성능을 훨씬 더 끌어올렸다. 이때 작업을 중단 없이 마쳤는지, 동일 상황에서 구동 메커니즘이 유지됐는지가 선별 기준이다. 일관성 없는 데이터는 추론을 오염시키기 때문에, 조도 변화나 관절 수치가 급변하는 오류(Noise) 구간을 걸러내는 데이터 정제 공정이 필수적이다.
물론 사람 동작 데이터가 로봇의 구동 신호로 즉각 변환되지는 않는다. 관절 구조와 자유도(DoF)가 달라 역학적 오차가 발생하기 때문이다. 서 연구원은 “일반적으로 로봇은 모터(Motor)·감속기(Reducer)를 거치며 응답 지연이 발생하고, 이 지연이 고속 접촉 순간에 위치·자세 오차로 이어진다”고 재차 강조했다.
사람은 시각·촉각을 실시간 결합해 보정하지만, 로봇은 제한된 센서 주기 안에서 이를 해결해야 한다는 것이 그가 짚은 과제다.
듀스는 현실의 마찰과 오차 속에서
‘무엇을 배울 수 있는 데이터로 변환해 남길 것인가’에
집중합니다.
김재현 로봇지능화팀 파트장이 제시한 아키텍처 역시 실행 중심의 구조와 궤를 같이한다. 듀스의 지능 체계는 하부의 구동 제어 기술 체계를 기반으로 삼는다. 여기에 실데이터를 확보하는 모방학습과 시뮬레이션 학습 등 구간을 유기적으로 결합해, 단일 플랫폼으로 통합 제어하는 구조를 채택했다. 그래서 탄생한 것이 로봇 지능 플랫폼 '브레인엑스(BrainX)'다.
김 파트장은 “가상·현실 데이터를 결합하는 엔드투엔드(End-to-end) 데이터 체계가 핵심”이라며 “자체 개발한 데이터 수집 장치 ‘글러브엑스(GloveX)’로 정밀한 실제 조작(Manipulation) 데이터를 수집하는 동시에, 가상 환경에서 방대한 합성 데이터를 상호 보완적으로 생성한다”고 설명했다. 쉽게 말해, 글러브엑스로 인간의 손재주(Dexterous) 데이터를 확보하고 이를 가상 환경과 연계해 학습 효율을 극대화한다는 발상이다.
이를 토대로 모방학습·강화학습부터 가상 데이터를 실제 로봇에 이식하는 ‘시뮬레이션·현실 전이(Sim2Real)’ 기술을 결합해 모델을 고도화했다. 데이터 수집 공정이 로봇 행동 지능 전체를 지탱하는 필수 과정임을 명확히 한 것이다.
이 통합 기술 체계를 실질적으로 떠받치는 동력은 현장에서 축적되는 생생한 실데이터다. 엑스와이지는 자신들이 직접 운영하는 자회사 카페 매장 현장에서 정리정돈, 재고 보충, 청소 등 실전 업무에 가까운 작업 데이터를 상시 축적하고 있다. 이를 다시 듀스의 학습 시스템으로 적용하는 선순환 체계를 병행 가동 중이다.
또한 조명 변화, 비정형적 대상물 위치, 배경 노이즈 등을 지속 다변화해 특정 환경에만 편향 학습되는 현상을 방지한다. 나아가 실증(Pilot) 공간에서 발생하는 실패 데이터를 수집 단계로 되돌려 재학습시키는 과정을 반복한다.
끝으로 서원호 연구원은 “가상·현실의 격차를 완전히 소거하기는 사실상 어렵다. 때문에 실제 현장에서 소량의 특정 데이터를 추가 수집해 미세 조정(Fine Tuning)하는 방식을 병행하고 있다”고 덧붙였다.
‘일상어 이해’라는 환상, VLA 모델도 만능 열쇠는 아니다
듀스가 사람의 동작을 수집했다면, 다음 과제는 그 흔적을 실제 행동으로 구현하는 일이다. 여기서부터는 작업을 어떻게 정의하고 어떤 데이터를 남기며, 어떤 실패를 재학습시킬지 하나의 구조 안에서 설계해야 하기 때문이다.
이신영 연구원은 듀스의 학습 구조를 설계하는 데 전략을 다하는 중이다. 그는 피지컬 AI에 대해 “센서로 환경을 인식하고, 그에 맞는 의사결정을 내린 뒤, 이를 물리 행동으로 실행하는 일련의 과정”으로 정의했다. 이는 인지·판단·제어를 따로 축적하는 기술 구조보다, 이 셋을 하나의 흐름으로 엮는 방식이 선행돼야 한다는 메시지로 연결된다.
김재현 파트장이 바라보는 듀스의 지능화 전략도 이와 동일하다. 핵심은 '실전형 피지컬 AI'의 구현이다. 양팔과 다중 DoF 로봇 손(Robot Hand)을 활용해, 사람과 공존하는 비정형 공간에서 고정밀 조작 메커니즘을 끝까지 수행해내는 것이 골자다.
목표 작업(Task)를 정의하고, 데이터를 수집·전처리한 뒤, 학습을 거쳐 실환경에서 평가하는 순서다. 그러나 실제 개발 현장에서는 이 과정이 일회성으로 끝나지 않는다. 평가 과정에서 마주하는 예상치 못한 변수와 실패 사례가 다시 데이터로 축적되고, 학습 구조도 그에 맞춰 수정된다.
이 연구원은 “과업 정의, 데이터 수집, 데이터 전처리, 학습, 실환경 평가 단계를 반복적으로 거친다”며 “이 같은 순환 체계를 지속 가동하면서 점진적으로 듀스 구동 안정성을 확보하고 있다”고 말했다.
로봇은 명령을 이해했다고 곧바로 움직이지 않아요.
명령을 내린 뒤 실패를 고쳐나가는 반복 과정이 순환돼야
비로소 로봇 행동이 완성되는 거죠.
이 관점은 시각·언어·행동(Vision·Language·Action) 모델도 만능 열쇠가 되지 못한다는 것을 시사한다. 언어(Language) 모델이 사람의 자연어(Natural Language)를 이해한다고 해서, 로봇이 그 명령을 곧바로 물리적 행동으로 전환하는 것은 전혀 다른 영역이라는 시각. 이 연구원은 시각·언어 정보를 결합해 환경을 이해한 후, 그 위에 일반 상식을 얹어 순차 계획으로 연결하는 구조를 설명한다.
인간은 성장하면서 시각·촉각·청각으로 물리 환경을 경험하며 물리 세계 이해체계, 곧 ‘월드 모델(World Model)’을 쌓는다. 반면 로봇은 이러한 경험·데이터 축적이 체계적으로 이루어지지 못한다. 모호한 지시 하나를 맥락(Context)·행동으로 자연스럽게 잇지 못하는 이유다. 사람에게 직관적인 “그거 집어줘”라는 명령이 로봇에게는 여전히 고난도 과제인 것이다.
이 때문에 듀스는 시행착오 기반의 학습보다 모방학습을 전면에 배치한다. 강화학습은 복잡한 작업 환경에서 보상(Reward)을 설계하는 것 자체가 까다롭다는 것이 그 배경. 이 연구원이 “모방학습을 중점으로 두고, 이를 강화학습으로 보조하는 방식”이라고 설명하는 것도 이와 결을 같이한다.
그는 데이터의 양이 늘어난다고 해서 성능이 선형적으로 올라가는 것도 아니라고 주장했다. 실제 로봇 운영 현장에서 텔레오퍼레이션만으로 충분한 규모의 데이터를 확보하는 데는 시간과 비용의 한계가 명확하다.
결국 관건은 데이터양보다, 불완전한 데이터를 얼마나 효과적으로 정제해 정형화할 수 있느냐다. 이 연구원은 “일정 수준 이상의 성능을 결정짓는 핵심은 불완전한 데이터를 효과적으로 사용하는 ‘가공 역량’”이라고 언급했다. 데이터 수집 방식의 단순화와 알고리즘 개선이 병행돼야 한다는 말이다.
이 대목에서 김재현 파트장이 제시한 '브레인엑스(BrainX)' 아키텍처가 결합된다. 듀스의 지능화는 실제 로봇 제어, 실데이터 기반 모방학습, 시뮬레이션 기반 학습을 개별적으로 구동하는 기존 업계 방식과 노선이 다르다. 김 파트장에 의하면, 이러한 방법론은 가상·현실 데이터를 유기적으로 통합하는 ‘전주기 데이터 체계’다.
현실 데이터만 수집하기엔 시간이 부족해요.
그렇다고 가상 데이터만 쓰기에도 정확도가 떨어지죠.
이 둘을 상호 보완하는 것이 중요합니다.
이 아키텍처는 실제 현장 운영 가능성에 초점을 맞춘다. 김 파트장은 듀스 상용화의 기준은 과도한 하드웨어 스펙이나 기술적 선전이 아니라, 실제 운영 경험에서 쌓이는 역량이라고 내세웠다. 데이터, 구동 안정성, 작업 효율성, 유지관리 비용 절감 등에 방점을 둔 기술 체계라는 것.
이처럼 로봇 지능화 구현은 통제되지 않는 비정형 공간에서 실질적인 가치를 창출하는 실용적 지능을 구현하는 문제다.
“만능 비서의 환상을 버려라” 현장이 로봇에 요구하는 진짜 태도
듀스와 같은 서비스 로봇은 소음, 다인원 목소리 개입, 모호한 지시 등 현장 내 변수를 극복하는 ‘맥락 추론 구조’가 상용화의 핵심이다. 엑스와이지는 듀스 청각·인지를 담당하는 음성 상호작용(Interaction) 최적화 작업에 고미종 파트장을 배치했다.
그는 듀스의 음성 상호작용을 단순 호출이 아닌, 의도를 듀스의 전체 워크플로로 연결하는 입력 채널로 정의했다. 정확한 인식부터 사람 말이 가리키는 물체·맥락, 다음 동작과의 연계성 등을 종합 판단해 범위를 좁히는 구조가 핵심이다.
고 파트장은 사용자 요구에 실시간 대응하는 다각적 상호작용 통로로 음성을 꼽았다. 음성이 로봇과의 정서적 거리를 좁히고 현장 내 수용성을 높이는 매개체라는 설명이다. 상황에 맞춘 적절한 오디오 톤과 상호작용적 친밀도는 사용자가 로봇을 자연스럽게 수용하도록 유도한다.
그는 이 과정에서 음성 상호작용과 단순 명령 인식을 분리했다. 명령 인식이 단어를 받아들이는 수준이라면, 실제 상호작용은 맥락 기반의 의도 추론과 재확인 단계까지 포함한다. 사람은 손이 바쁘거나 시선이 정체됐을 때 로봇을 부른다. 이때 로봇은 작업 전환과 예외 상황 처리의 시작점으로 음성을 받아들여야 한다.
말을 알아듣는 기술과 사람의 의도를 끝까지 확인하는 기술은 다르다는 것이죠.
그래서 듀스의 음성 상호작용은 어떻게 오류를 좁혀가느냐에 집중한다. 고미종 파트장은 “로봇이 사람 지시를 잘 못 알아들었을 때도 자연스럽게 대화를 유도해 의도를 좁혀가는 구조가 훌륭한 사용자 경험(UX)을 제공할 것”이라고 확신했다. 이를 위해, 지시가 모호하면 되물어 확인하고, 로봇의 시선이나 사람의 손짓 등 시각적 단서를 결합해 범위를 줄이는 접근을 수행하고 있다.
이때 로봇은 확신이 없으면 무리하게 구동하지 않는다. 사고를 내는 것보다 멈추는 방향이 안전하기 때문이다.
이 지점에서 음성은 시각·청각 등 다각적 감각 정보를 통합 처리하는 ‘멀티모달(Multimodal)’ 기술이 상호작용의 뿌리가 된다. “컵 좀 치워줘”라고 지시하면, 상황에 따라 대상·동작이 달라지므로, 말과 동시에 ▲시선 ▲손 위치 ▲작업 상태 등을 함께 인지·분석해야 한다는 생각에서다. 결국 사용자가 바라는 것은 로봇이 맥락을 읽고 작업 흐름을 끊지 않는 ‘반응성’이다.


▲ 엑스와이지가 최근 공개한 승차 구매(Drive-thru) 솔루션 ‘바리스 DT(Baris DT)’는 앞선 UX 최적화 목표를 달성하기 위한 기술이다. (촬영·편집 : 헬로티 최재규 기자)
실패 처리도 같은 철학을 따른다. 듀스는 인식 실패를 숨기지 않는다. “알아듣지 못했으면 솔직히 안내하고, 모호할 때는 재확인하며, 작업이 어려우면 상태를 설명한 뒤 선택지를 제시한다”고 고 파트장이 뒷받침하며 말했다. 이러한 투명성이 사용자 경험의 본질이라는 관점이다.
그는 “완벽한 줄 알았다가 오류를 내면 사용자는 신뢰를 완전히 잃는다. 한계를 드러내더라도 작업을 안정적으로 완결 짓는 태도가 더 중요하다”고 덧붙였다.
서비스 로봇의 신뢰는 완벽한 인식만으로 결정되지 않아요.
멈춰야 할 때 멈추고, 다시 물어야 할 때 묻는 유연함이 중요합니다.
앞서 김재현 파트장이 말한 통합 아키텍처는 여기서 완성된다. 듀스의 지능화는 현장 데이터를 모으고, 행동으로 학습시키며, 음성을 워크플로에 유기적으로 집어넣는 하나의 메커니즘으로 통합 기능한다. 고미종 파트장이 주도하는 음성 상호작용은 이 구조의 최상위 실행 단계다.
수집한 데이터를 끝까지 행동으로 구현·구도화하는 메커니즘,
그것이 서비스 로봇 지능화 실현의 관건
헬로티 최재규 기자



















































