IT 에임인텔리전스, 컴퓨터 에이전트 보안 취약성 실증 연구 발표
에임인텔리전스가 컴퓨터 사용 에이전트의 보안 취약성을 실증한 연구를 발표했다. 연구는 오픈AI의 GPT Operator, 앤트로픽의 Claude, 구글의 Gemini 등 실제 사용 중인 AI 기반 컴퓨터 사용 에이전트를 대상으로 진행됐다. 연구 결과 해당 AI가 악성 명령을 우회적으로 수용하고 실행하는 취약성이 확인됐다. 연구진은 이를 위해 'SUDO(Screen-based Universal Detox2Tox Offense)' 프레임워크를 개발했다. 이 프레임워크는 AI의 안전 정책을 우회해 악성 행동을 유도하는 구조다. 무해한 표현으로 요청을 변환한 뒤 Vision-Language 모델을 통해 실행 단계를 생성하게 하고, 마지막 순간에 악성 요청으로 되돌리는 '톡시파이(toxify)' 과정을 거친다. AI가 거절할 경우, 거절 사유를 분석해 공격 방식을 수정하며 반복 시도했다. 초기 시도 성공률은 24%, 전략 수정 시 최대 41%까지 증가했다. 에임인텔리전스는 본 실험에서 50가지 악성 시나리오를 구성해 검증을 진행했다. 사용자 폴더 삭제, 외모에 대한 욕설, 위험 물질 구매, 도박 사이트 배팅 등 현실적인 위협 사례가 포함됐다. 연구는 개인정보 유출,