이제는 단순히 말만 하는 AI 음성비서를 넘어, 인공지능이 직접 화면을 보고 판단해 택시를 호출하고 SRT 티켓을 예매하는 시대가 열렸다. KAIST는 전산학부 신인식 교수가 이끄는 AutoPhone 팀(플루이즈·KAIST·고려대·성균관대)이 과학기술정보통신부가 주최한 ‘2025 인공지능 챔피언(AI Champion) 경진대회’에서 초대 AI 챔피언(1위)에 선정됐다고 6일 밝혔다. 이번 대회는 AI 기술의 혁신성과 사회적 파급력, 사업화 가능성을 종합 평가하는 국내 최대 규모의 AI 기술 경진대회로, 전국 630개 팀이 참가한 가운데 AutoPhone 팀이 최고 영예를 차지하며 연구개발비 30억 원을 지원받는다. AutoPhone 팀이 개발한 ‘FluidGPT’는 사용자의 음성 명령을 이해해 스마트폰이 스스로 앱을 실행하고 클릭·입력·결제까지 완료하는 완전 자율형 AI 에이전트 기술이다. 예를 들어, 사용자가 “서울역에서 부산 가는 SRT 예매해줘” 또는 “택시 불러줘”라고 말하면, FluidGPT는 실제 앱을 열고 필요한 단계를 순차적으로 수행해 결과를 완성한다. 이 기술의 핵심은 ‘비침습형(API-Free)’ 구조다. 기존에는 택시 앱(API)을 이용해
인핸스가 자사 모델 ‘ACT-1’로 글로벌 벤치마크에서 상위권에 올랐다. 인핸스는 22일, 세계 최고 권위의 웹 AI 에이전트 평가 리더보드인 ‘Online-Mind2Web’에서 ACT-1이 전체 3위를 기록했다고 밝혔다. 이는 오픈AI의 Operator, 앤트로픽의 Claude Computer Use 3.7과 함께 상위권을 형성하며, 국산 웹 AI 기술의 가능성을 알린 성과로 평가된다. Online-Mind2Web은 실제 운영 중인 136개 웹사이트에서 300개의 작업을 기준으로 AI 에이전트의 수행 능력을 검증하는 국제 벤치마크다. 단순 정답률 평가를 넘어, 사람과 AI가 이중으로 평가에 참여해 실질적인 문제 해결 능력을 판단하는 시스템으로 신뢰성이 높다. 인핸스의 ACT-1은 DOM(Document Object Model) 제어 방식에서 1위를 기록했으며, 커머스 분야에서도 1위를 달성했다. DOM 제어 방식은 웹페이지의 구조에 직접 접근해 UI 요소를 제어하는 방식으로, 기존의 스크린샷 기반 제어나 좌표 기반 방식에 비해 정확성과 유연성이 뛰어난 것으로 평가된다. 이 기술을 통해 동적 페이지나 보안이 엄격한 환경에서도 효과적인 자동화가 가능하다. AC