미디어·방송, 공공·안전, 법률·수사기관 등 주요산업 중심으로 영상 AI 고도화 추진 트웰브랩스가 LG CNS와 영상 분석 기술 협력을 위한 업무협약(MOU)을 체결했다. 이번 협력은 멀티모달 기반 영상 이해 기술과 디지털 전환(AX) 역량의 결합을 통해 다양한 산업 분야에서 실질적인 AI 영상 솔루션을 공동 개발하고 사업화하는 것을 목표로 한다. 양사는 트웰브랩스의 영상 이해 특화 AI 모델(Video Foundation Model, VFM) 고도화를 위한 연구 개발과 더불어, 이를 실제 고객 환경에 적용하는 상용 서비스 구축에도 협력한다. 특히 미디어·방송, 공공·안전, 법률·수사기관 등 영상 데이터가 집중되는 산업을 중심으로 영상 AI 기술을 고도화하고, 새로운 비즈니스 기회를 함께 발굴할 예정이다. 트웰브랩스는 멀티모달 신경망 기술을 기반으로 영상 콘텐츠 내 인물, 사물, 텍스트, 행동 등을 복합적으로 이해하는 AI 모델을 개발해 왔다. 지난 4월에는 국내 AI 기업 최초로 아마존 베드록에 자사의 멀티모달 AI 모델 ‘마렝고(Marengo)’와 ‘페가수스(Pegasus)’를 공급하는 성과를 올리며 글로벌 경쟁력을 입증한 바 있다. LG CNS는 금융권
알리바바 클라우드가 AI 기반 비디오 생성 모델 ‘Wan2.1’ 시리즈를 오픈소스로 공개하며, 글로벌 AI 커뮤니티와의 협력을 강화한다고 밝혔다. 이번에 공개된 모델은 140억(14B) 및 13억(1.3B) 매개변수 버전으로 텍스트 및 이미지 입력을 기반으로 고품질의 영상을 생성할 수 있도록 설계됐다. 알리바바 클라우드는 비디오 파운데이션 모델 ‘Tongyi Wanxiang(통이 완샹)’의 최신 버전인 Wan2.1을 ‘모델스코프(ModelScope)’ 및 ‘허깅페이스(Hugging Face)’를 통해 전 세계 연구자 및 기업들에게 공개했다. 해당 모델은 복잡한 동작을 정밀하게 처리하고 픽셀 품질을 향상시키며 물리적 원칙을 준수하는 등 사실적인 영상 생성 능력에서 강점을 보인다. Wan2.1은 영상 생성 모델의 종합 벤치마크인 VBench 리더보드에서 종합 점수 86.22%를 기록하며 1위를 차지했다. 특히, 상위 5개 모델 중 유일한 오픈소스 모델로 자리매김하며 글로벌 AI 생태계에서 기술력을 입증했다. 평가 항목에서는 움직임의 자연스러움, 색상 표현, 다중 객체 상호작용 등의 성능이 뛰어난 것으로 나타났다. 이번 공개된 모델 중 T2V-14B는 복잡한 동작