[헬로AI] ‘영상 이해 AI의 판도 바꿨다’ 트웰브랩스의 멀티모달 혁명

2025.03.19 13:57:25

서재창 기자 eled@hellot.net


트웰브랩스 윤은경 PM 인터뷰

멀티모달 AI가 본격적으로 전 산업에 확산되는 가운데, 영상을 이해하는 AI 기술이 주목받고 있다. 오픈AI의 Sora, 구글의 Gemini 1.5 등 대형 AI 모델은 영상 생성 및 분석 기능을 강화하며, 기업은 영상 데이터의 실시간 이해와 그에 따른 활용법을 모색하고 있다. AI 영상 이해 기술은 단순한 개체 인식 수준을 넘어, 시간에 따른 맥락을 고려한 장면 분석과 의미 해석까지 가능한 단계로 발전했다. 이에 트웰브랩스는 영상 자체를 네이티브 데이터로 학습하는 접근 방식을 채택함으로써 AI 시장에서의 독보적인 입지를 강화하고 있다. 


 

맥락 이해에 탁월한 트웰브랩스의 기술력

 

영상 데이터의 활용 가능성은 무궁무진하다. 텍스트 중심의 AI 모델을 넘어 멀티모달 AI의 무게감이 커짐에 따라, 트웰브랩스는 영상 이해 기술을 바탕으로 한 AI 모델을 개발하며 업계로부터 주목받았다.

 

 

특히, 영상 데이터를 텍스트와 결합해 학습하는 독자적인 접근법으로 기존 대형 AI 모델과 차별화함으로써 기술적 우위를 점했다. 오픈AI와 구글과 같은 빅테크 기업이 텍스트와 이미지를 기반으로 영상을 이해하려는 방식과 달리, 트웰브랩스는 처음부터 영상 데이터를 독립적인 학습 대상으로 삼아 정교한 이해가 가능하도록 했다.

 

다시 말해, 기존 AI 모델은 개별 프레임을 분석해 정보를 조합하는 방식이지만, 트웰브랩스의 AI는 영상 전체를 하나의 연속적인 데이터로 보고 학습한다. 윤은경 PM은 “예를 들어, ‘타이타닉이 침몰하는 영상’을 분석할 때, 기존 모델은 침몰 전과 후의 이미지만 비교해 변화가 발생했다고 판단한다. 반면, 트웰브랩스의 모델은 배가 점진적으로 물속으로 가라앉는 과정 자체를 이해할 수 있어 정확한 맥락 분석이 가능하다. 이는 영상 내 사물의 움직임, 사람의 행동 패턴, 특정 이벤트의 흐름 등을 세밀하게 파악도록 해준다”고 밝혔다.

 

이와 함께 트웰브랩스는 비디오 네이티브 모델을 개발해 AI가 영상을 자연스럽게 분석하고 처리하도록 했다. 기존 모델이 영상 데이터를 이미지 프레임 단위로 나눠 분석하는 반면, 트웰브랩스의 모델은 영상의 시공간적 맥락을 고려해 분석을 수행한다. 이러한 방식은 영상 데이터 처리 속도를 획기적으로 개선하고, 불필요한 데이터 처리를 줄여 비용 절감 효과를 가져온다. 한 예로, 트웰브랩스의 AI 모델은 영상 속 사물의 움직임과 맥락을 자연스럽게 파악해 스포츠 경기 분석, 자동 하이라이트 생성, 실시간 콘텐츠 검색 등의 분야에서 강점을 발휘한다.

 

최근 트웰브랩스는 캐나다의 스포츠 엔터테인먼트 기업인 MLSE(Maple Leaf Sports & Entertainment)와의 협업으로 AI 기반 영상 분석 기술을 실제 프로덕션 단계에 적용했다. MLSE는 여러 스포츠 구단을 운영하며 매 시즌마다 방대한 양의 경기 영상을 보유한다. 트웰브랩스의 AI는 이러한 영상 데이터를 자동으로 분석해 하이라이트 클립을 생성하고, 특정 플레이어의 움직임이나 경기 주요 장면을 빠르게 검색하도록 돕는다.

 

트웰브랩스는 엔터테인먼트 산업 내 대형 콘텐츠 제공업체와도 협업을 확대하고 있다. 미디어 및 방송사가 보유한 대규모 아카이브 영상을 효과적으로 정리하고, 필요한 장면을 빠르게 찾도록 하는 AI 기반 검색 및 편집 기술이 핵심이다. 이는 기존의 수작업 편집 및 분류 방식보다 빠르고 정확한 결과를 제공하며, 방송 제작 환경의 효율성을 획기적으로 높여준다.

 

 

‘영상 분석부터 의사 결정까지’ 진화하는 AI

 

트웰브랩스는 자사의 영상 AI 모델인 ‘마렝고 2.7’과 ‘페가수스 1.2’를 앞세워 본격적인 시장 공략에 나섰다. 최근 트웰브랩스는 페가수스 1.2 모델을 공개하며 영상 분석 속도와 정확도를 한층 개선했다. 이와 함께 페가수스 1.2는 고급 비전 인코딩 전략과 정교한 토큰 감소 기술을 활용해 상대적으로 가벼운 모델 크기로 개선된 성능을 구현하는 데 성공했다. 

 

무엇보다 기존의 초거대 AI 모델보다 빠른 응답 속도와 낮은 비용으로 제공한다는 점이 고무적이다. 이번 업데이트는 장시간 영상을 빠르게 분석하고 요약하는 데 강점을 보이며, 기존 모델 대비 약 2~3배에 가까운 비용 절감 효과를 제공하는 것으로 알려졌다.

 

윤은경 PM은 “기존 영상 AI 모델은 1시간 이상의 장시간 영상을 분석하는 데 어려움을 겪었다. 일반적으로 긴 영상을 처리하려면 4초 단위로 이미지를 나눠 개별 프레임을 분석한 후 이를 조합하는 방식이 사용됐다. 그러나 이러한 방식은 시간이 오래 걸릴 뿐 아니라, 불필요한 데이터를 처리하는 데 많은 리소스를 소비한다”고 설명했다. 이어 그는 “페가수스 1.2는 영상을 처음부터 끝까지 모두 분석하는 게 아닌, AI가 맥락을 파악한 후 필요한 부분만을 추출해 처리하는 방식을 채택했다. 이를 통해 응답 속도를 대폭 개선했으며, 긴 영상에서도 빠르고 정확한 분석이 가능해졌다”고 덧붙였다.

 

이러한 트웰브랩스의 기술 도약은 단순히 성능 향상에 그치지 않고, AI 기반 영상 분석이 실제 산업에서 활용될 수 있다는 가능성을 높였다. 즉 다양한 분야에서 AI가 실시간으로 영상 데이터를 분석하고 의사 결정을 지원하는 환경이 조성되는 셈이다. 기업 고객을 대상으로 한 맞춤형 AI 솔루션 개발이 가속화한다면, 트웰브랩스의 기술력은 점차 경쟁력을 갖출 전망이다.

 

이에 트웰브랩스는 영상 AI 기술을 엔터프라이즈 환경에서도 손쉽게 활용하도록 준비하고 있다. 기업은 AI 솔루션 도입 시 데이터 보안과 인프라 구축, 운영 비용 등의 문제를 고려하는데, 이러한 문제를 해결하기 위해 트웰브랩스는 엔터프라이즈 맞춤형 솔루션을 개발한다. 고객이 자체 데이터 센터에서 AI 분석을 수행하도록 지원하며, GDPR, SOC 2와 같은 글로벌 보안 규정을 준수하는 시스템을 구축한다.

 

앞으로도 트웰브랩스는 AI 기반 영상 분석 기술을 확장해 다양한 산업에서 활용되도록 지원할 계획이다. 특히 AI 기술을 단순한 분석 도구가 아니라, 의사결정을 지원하는 에이전트로 발전시키고자 한다. 이를 위해 트웰브랩스는 AI가 영상을 분석하고 의미를 파악한 후, 적절한 조치를 취하도록 하는 ‘비디오 RAG 에이전트’ 개발을 진행 중이다.

 

윤은경 PM은 “이 기술이 도입되면, AI는 영상 분석을 넘어, 영상 데이터를 기반으로 자동으로 의사 결정을 내리고 업무를 수행하는 단계로 발전한다. 우리는 지속해서 AI의 실질적인 활용 가치를 극대화하는 데 집중할 것”이라고 말했다. 궁극적으로, 트웰브랩스는 단순한 AI 연구 개발 기업이 아닌 실제 산업에서 AI가 활용되도록 돕는 선구적인 기업으로 성장하겠다는 목표를 밝혔다. 글로벌 시장에서의 경쟁력을 강화함으로써 영상 AI 기술의 새로운 표준을 만들어가는 트웰브랩스의 행보가 기대된다.

 

헬로티 서재창 기자 |

Copyright ⓒ 첨단 & Hellot.net





상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c) HelloT all right reserved.