NC AI, 한국어 특화 멀티모달 모델 4종 오픈소스로 공개

2025.07.16 10:20:06

[얼리버드 등록-AI TECH 2026] “AI, 아직도 PoC 단계입니까? 이제 ‘성과’로 답할 때입니다”...AI 융합 비즈니스 개발 컨퍼런스 (5/6, 코엑스3층 E홀)

14B, 1.7B, 1.7B OCR, 임베딩 모델 등 총 4종 공개

NC AI가 멀티모달 인공지능(AI) 기술력의 집약체인 ‘VARCO-VISION 2.0’ 모델 4종을 공개하며 국내 AI 기술의 글로벌 경쟁력을 입증했다. 공개된 모델은 14B, 1.7B, 1.7B OCR, 임베딩 모델 등 총 4종으로 구성되며, 이미지와 텍스트, 비디오 정보를 동시에 이해하고 처리하는 고성능 비전-언어모델(VLM)이다.

이번 발표의 핵심은 140억 파라미터(14B) 규모의 멀티모달 모델로, NC AI는 해당 모델이 영문 이미지, 한국어 이미지 이해, OCR 분야에서 InternVL3, Ovis2, Qwen2.5-VL 등 글로벌 오픈소스 최고 성능 모델을 능가했다고 밝혔다. 또한 중소형 환경에서도 사용 가능한 1.7B 경량 모델과 OCR 특화 모델, 텍스트-이미지-비디오 간 의미적 유사도를 계산하는 임베딩 모델도 함께 선보였다.

VARCO-VISION 2.0은 복잡한 문서, 표, 차트 등을 동시에 분석할 수 있는 다중 이미지 처리 역량과 한국어 중심의 텍스트 생성 능력, 한국 문화 이해도를 향상시킨 것이 특징이다. 특히, AnyRes 방식으로 다양한 해상도를 손실 없이 처리할 수 있어 OCR 정확도를 끌어올렸으며, 흐릿하거나 노이즈가 많은 이미지도 정밀하게 판독한다.

임베딩 모델은 영상 콘텐츠를 숫자 기반 벡터로 변환하고 검색 벡터 개념을 적용해 고정밀 비디오 검색까지 가능하도록 설계됐다. 기존 고성능 이미지-텍스트 검색 모델의 성능을 비디오 영역에 이식하는 방식으로, MultiVENT2.0 제로샷 벤치마크에서 최고 성능을 기록했다.

이들 모델은 문서 자동화, 이미지 기반 설명 생성, 콘텐츠 검색, 미디어 분석 등 다양한 산업군에서 활용할 수 있으며, 특히 스마트폰이나 PC에서 구동 가능한 경량화 버전은 개인 개발자와 일반 사용자에게도 실질적인 도입 기회를 제공한다. NC AI는 이번 모델들을 모두 연구용 오픈소스로 공개해 누구나 자유롭게 사용할 수 있도록 했다.

기술적 효율성도 강조됐다. 고품질 데이터 선별 및 합성 기술을 통해 적은 컴퓨팅 자원으로 대규모 데이터를 학습할 수 있도록 최적화했으며, 임베딩 모델의 경우 선호 최적화 데이터셋을 대조 학습에 맞게 변형하는 방식으로 데이터 효율을 극대화했다.

이연수 NC AI 대표는 “텍스트 중심의 LLM을 넘어 비전과 언어를 함께 이해하는 비전언어모델로 패러다임이 전환되고 있다”며, “이번 공개를 통해 NC AI가 국내 멀티모달 AI 기술 주권 확보에 앞장서고 있음을 확인했다”고 밝혔다.

이번 4종 공개는 NC AI가 파운데이션 모델부터 멀티모달 모델까지 독자 기술로 구축할 수 있는 역량을 갖췄음을 의미하며, 정부가 추진 중인 ‘소버린 AI’ 전략과도 방향을 같이한다. 향후 금융, 교육, 유통, 콘텐츠 산업 등 국내 주요 산업 전반에서 생성형 AI의 실질적 확산을 견인할 것으로 기대된다.

헬로티 서재창 기자 |

서재창 기자 의 전체기사 보기