크라우드웍스가 과학기술정보통신부와 한국전파진흥협회가 추진하는 ‘방송영상 AI 학습용 데이터 구축 사업’을 수주했다. 이번 사업은 국내 방송영상 원본을 기반으로, 방송영상 특화 AI 모델 개발에 필요한 고품질 학습 데이터를 구축·검증하는 것을 목표로 한다. 과기부와 한국전파진흥협회는 총 4개 컨소시엄을 선정했으며, 각 컨소시엄에 48억3천만 원씩, 총 193억2천만 원을 지원한다. 크라우드웍스는 MBC를 주축으로 iMBC, 데이터메이커, LG경영개발원 AI연구원 등과 컨소시엄을 구성해 총 5,000시간 규모의 AI 학습용 데이터셋을 구축할 예정이다. 이번 프로젝트에서 크라우드웍스는 한국 문화와 시대적 특성을 반영한 방송영상 이해 데이터셋 구축에 주력한다. 특히 AI가 영상의 맥락을 보다 정밀하게 이해할 수 있도록 데이터를 설계하고 가공하는 역할을 맡는다. 이를 위해 영상 속 주요 객체와 행동, 장면 등을 동시에 분석하는 다중 라벨링 방식을 적용해 시청각 정보를 기반으로 의미를 추론할 수 있는 데이터셋을 구현한다. 멀티모달 AI 학습을 위한 데이터셋 구축도 핵심 과제다. 영상, 이미지, 자연어 등 다양한 정보를 복합적으로 구성해 AI가 영상 내용을 정확하게 인식
부산외대의 언어·지역학 전문성과 크라우드웍스 AI 데이터 기술력 결합해 언어 데이터 구축 크라우드웍스가 부산외국어대학교와 손잡고 고품질 다국어 AI 데이터 구축 및 전문 인재 양성에 나선다. 양측은 7일 포괄적 업무협약(MOU)을 체결하고, 언어 기반 AI 기술력 고도화와 저자원 언어 지원 확대를 위한 실질적 협력을 본격화한다고 밝혔다. 이번 협약은 부산외대가 보유한 언어·지역학 전문성과 크라우드웍스의 AI 데이터 기술력을 결합해 다양한 언어 데이터를 공동 구축하고 이를 활용할 수 있는 AI 솔루션을 함께 개발하는 것이 핵심이다. 특히 저자원 언어 데이터를 포함한 고품질 AI 학습용 데이터셋 확보와 이를 기반으로 한 언어 AI 서비스 고도화를 추진한다는 점에서 의미가 크다. 양측은 다국어 데이터 수집 및 가공, AI 학습용 데이터셋 구축, 언어 기반 AI 솔루션 공동 개발 등의 분야에서 협력할 예정이다. 부산외대의 글로벌 언어 교수진과 해외 네트워크, 그리고 크라우드웍스의 ‘워크스테이지(Workstage)’, ‘알피 날리지 컴파일러(Alpy Knowledge Compiler)’와 같은 데이터 구축 솔루션을 접목해 효율성과 정확성을 높일 계획이다. 이뿐 아니라