AI 에이전트의 발전 속도가 심상치 않다. 오픈AI의 챗GPT를 위시한 생성형 AI의 등장은 전 산업계에 변혁을 일으켰다. 이후 양질의 데이터를 기반으로 성능을 개선해 온 생성형 AI는 정해진 답변 혹은 요구하는 답변을 제안하는 데 그치지 않고, 보다 능동적인 주체로 거듭나고 있다. 그 중심에 있는 AI 에이전트는 개선된 성능과 기능을 바탕으로 일상과 업무 환경에 적용됨으로써 AGI 시대를 여는 첨병을 자처하고 있다.
AI 에이전트, AGI 시대 주도하다
AI 에이전트는 사용자나 시스템을 대신해 자율적으로 작업을 수행하는 소프트웨어 프로그램이다. AI 에이전트는 자연어 처리, 의사 결정, 문제 해결, 외부 환경과의 상호 작용 등 다양한 기능을 수행하며, 소프트웨어 설계 및 IT 자동화부터 코드 생성 도구 및 대화형 어시스턴트에 이르기까지 다양한 분야에서 활용되는 추세다. AI 에이전트는 반복적으로 시간이 소요되는 작업을 자동화함으로써 직원이 더 복잡한 업무에 집중하도록 지원한다. 한 예로, 고객 서비스 분야에서 AI 에이전트는 고객의 질문에 신속하게 응답하고 문제를 해결하는 데 도움을 준다.
이처럼, AI 에이전트는 개인화한 사용자 경험을 제공하는 데 최적화한 기술이다. 사용자의 선호도와 행동을 학습해 맞춤형 서비스를 제공함으로써 사용자 경험을 향상시키킨다. 예를 들어 스마트홈 환경에서의 AI 에이전트는 사용자의 일상생활에 밀착돼 도움을 주는 디지털 비서로 활용되며, 사용자와의 상호작용을 통해 신뢰감과 친밀감을 형성하게 된다. 의사 결정에 있어서도 효율적인 성능을 보인다. 에이전트는 대량의 데이터를 분석하여 인사이트를 도출하고, 이를 바탕으로 의사 결정을 지원한다.
AI 에이전트는 단순한 규칙 기반 시스템에서부터 복잡한 의사 결정과 문제 해결을 수행하는 고도화한 시스템까지 다양하다. 활동 범위 역시 특정 도메인에 특화한 에이전트부터 다양한 분야에서 활용 가능한 범용 에이전트까지 폭넓게 분포돼 있다. 무엇보다 AI 에이전트는 인공일반지능(AGI)으로 향하는 과정에서 중요한 역할을 수행할 것으로 예상된다.
AGI는 인간과 유사한 방식으로 학습, 추론, 문제 해결을 수행하는 AI를 지향하며, AI 에이전트의 발전은 이러한 AGI의 실현 가능성을 높이고 있다. 예를 들어, 오픈AI의 AGI 개발 로드맵에서 AI 에이전트는 장기적인 과제 수행이 가능한 단계(Level 3)로 분류되며, 이는 AGI로 향하는 중요한 발전 단계로 간주된다.
AI 에이전트 리더십 선점할 기업은?
지난 12월 구글은 자사의 최신 AI 모델 ‘제미나이 2.0’을 출시해 화제를 일으켰다. 지난 2023년 12월 ‘제미나이 1.0’을 처음 선보인 지 1년 만이다. 지난해 2월에는 1.5 버전도 공개한 바 있으나, 현재까지 가장 뛰어난 성능을 자랑하는 제미나이 2.0은 텍스트를 비롯해 이미지와 동영상 기능을 갖춘 멀티모달형에 더해 AI 에이전트 시대에 걸맞은 모델이라는 평가다. 이용자 에이전트가 될 수 있도록 빠른 응답, 자연스러운 대화와 멀티모달 기능이 강화됐다.
여기에 자체 개발한 6세대 칩(TPU)인 ‘트릴리움(Trillium)’을 기반으로 구축됐으며, 정보를 구성하고 이해하는 수준을 넘어 정보를 더 유용하게 만든다. 구글은 제미나이 2.0을 개발자와 테스트 프로그램 대상자에게 제공하며, 구글 검색을 시작으로 전 제품에 빠르게 적용할 계획이라고 밝혔다. 데미스 하사비스 구글 딥마인드 CEO는 “제미나이 2.0은 다양한 기능 조합, 자연스러운 상호작용, 빠른 응답 속도, 복잡한 작업 처리 능력으로 새로운 차원의 에이전트형 기반 경험을 제공한다”고 설명했다.
앞서 마이크로소프트(MS)도 ‘이그나이트 2024’를 통해 마이크로소프트 365 코파일럿의 신규 AI 에이전트와 기능, 자율 에이전트 등을 선보였다. MS는 행사에서 화상 회의 중 이용자의 목소리를 실시간으로 학습해 9개 언어로 통역해 주는 통역 에이전트 등 다양한 AI 에이전트를 공개한 바 있다. 이 외에도 특정 사이트나 파일, 폴더가 있는 곳을 쉽게 찾아주는 셰어포인트 에이전트, 직원들이 휴가 신청을 하고 급여 및 복지 정보를 대신 확인해 주는 직원 셀프 서비스 에이전트도 소개됐다.
이와 함께 AI 모델 코파일럿을 활용해 사용자가 직접 AI 에이전트를 만드는 플랫폼인 ‘코파일럿 스튜디오’도 미리보기 형태로 공개됐다. 이뿐 아니라 다양한 에이전트가 들어 있는 ‘에이전트 라이브러리’를 활용해 상황에 따라 반복적인 작업을 수행하는 에이전트를 구축할 수도 있다.
오픈AI는 컴퓨터를 스스로 제어하고 작업을 수행하는 AI 에이전트 출시를 준비 중인 것으로 알려졌다. 블룸버그 통신의 보도에 따르면, 오픈AI 경영진이 내부 회의에서 ‘오퍼레이터’라는 코드명의 이 AI 에이전트가 2025년 1월 연구용 프리뷰 및 개발자용 도구로 공개될 예정이라고 밝혔다고 전했다. 이 AI 에이전트의 구체적인 기능과 소비자 출시 시기는 알려지지 않았지만, 스스로 컴퓨터를 제어하고 독립적으로 작업을 수행하는 기능을 갖췄을 것으로 예상되고 있다.
블룸버그 통신은 이 프로젝트가 AI 시스템이 텍스트와 이미지 처리를 넘어 컴퓨터 인터페이스와 상호작용하는 단계로 나아가고 있음을 의미한다고 분석했다. 샘 올트먼 오픈AI CEO는 SNS 플랫폼 레딧에서 “우리는 더 나은 모델을 갖게 될 것이며, 다음 거대한 돌파구는 AI 에이전트가 될 것”이라고 언급했다.
해외뿐 아니라 국내에서도 AI 에이전트 개발에 매진하는 기업들이 있다. 지난해 12월 LG AI연구원은 ‘엑사원 3.5’를 오픈소스로 공개하며 업계의 주목을 받았다. LG AI연구원은 온디바이스용 초경량(2.4B), 범용 목적의 경량(7.8B), 특화 분야에 활용하는 고성능(32B) 등 엑사원 3.5 모델 3종을 모두 오픈소스로 공개했다. 기존 엑사원 3.0은 범용 목적의 경량 모델만 공개한 바 있다.
LG AI연구원은 임직원 대상으로 ‘챗엑사원(ChatEXAONE)’ 정식 서비스도 시작했다. 엑사원을 기반으로 만든 챗엑사원은 정보 암호화, 개인 정보 보호 기술을 적용해 임직원이 사내 보안 환경 내에서 내부 데이터의 유출 걱정 없이 업무에 활용하는 기업용 AI 에이전트다. LG AI연구원은 그간 스스로 행동하는 액션 AI 연구를 진행해 온 것을 바탕으로 올해 LAM 기반 AI 에이전트 개발을 목표로 삼았다.
헬로티 서재창 기자 |