배너
닫기
배너

앤스로픽, 해커 악용 우려로 '미소스' AI 모델 출시 제한

URL복사

 

AI 기업 앤스로픽(Anthropic)이 신규 AI 모델 '클로드 미소스 프리뷰(Claude Mythos Preview)'가 해커들의 사이버 공격에 악용될 소지가 있다고 판단해 일반 공개를 제한하기로 결정했다. AI 모델의 뛰어난 코딩·추론 능력이 오히려 사이버 위협 도구로 전용될 수 있다는 우려가 현실화되면서, 안전성을 이유로 최신 AI 모델의 배포를 스스로 제한한 이례적인 사례로 주목받고 있다.

 

앤스로픽 직원들은 이 프로젝트를 투명한 나비에 빗대어 소프트웨어 취약점을 상징하는 '프로젝트 글래스윙(Project Glasswing)'이라는 이름으로 진행했다. 클로드 미소스 프리뷰는 사이버 보안을 위해 특별히 훈련된 모델이 아닌 범용 모델임에도 불구하고, 뛰어난 코딩과 추론 능력 덕분에 이전에는 탐지하기 어려웠던 버그를 찾아낼 수 있다. 실제로 이 모델은 보안을 강조하는 운영체제 오픈BSD(OpenBSD)에서 27년 된 버그를 식별해내는 성능을 보였으며, 그 가운데 일부는 치명적인 것으로 알려졌다.

 

앤스로픽은 이 모델을 제한적으로 운용하되, 핵심 소프트웨어 인프라를 구축·유지 관리하는 기업들과의 파트너십을 통해 자체 시스템과 오픈소스 시스템 보호에 활용할 계획이다. 이 목적으로 최대 1억 달러의 사용 크레딧을 약속했으며, 파트너들은 해당 한도를 초과하면 모델 사용료를 지불해야 한다. 일반 공개 계획은 없으며 궁극적으로 미소스급 모델을 대규모로 안전하게 배포하는 방법을 배우는 것이 목표라고 밝혔다.

 

앤스로픽의 프론티어 레드팀 사이버 책임자인 뉴턴 쳉(Newton Cheng)은 "사이버 보안은 광범위한 역량 증가가 위험을 초래할 수 있는 분야이므로, 우리는 그곳에서 일어나는 일을 면밀히 주시해야 한다"고 강조했다. 그는 회사가 적들이 악용할 수 있는 모델을 "무모하거나 무책임하게" 출시하는 것을 피하려 한다고 밝혔다.

 

헬로티 김재황 기자 |











배너


배너

배너


배너


주요파트너/추천기업