AI 학습 데이터 플랫폼 셀렉트스타는 29일 인공지능 학습 데이터 총판 사업을 본격화한다고 밝혔다. 데이터 저작권자와 협의를 거쳐 도서, 이미지, 영상, 대화 등 고품질 데이터를 AI 기업에 유통 및 판매한다는 내용이다. 셀렉트스타가 공개한 데이터셋 카탈로그에는 ▲법률·생활·금융·건강 등 전문가 질의 응답 ▲전문 분야 도서 ▲글로벌 이미지 플랫폼 제휴 사진·일러스트·영상 ▲다국어 일상 대화 및 번역 데이터셋 ▲언리얼 엔진 기반 합성 데이터 등이 포함돼 있다. 카탈로그 대부분이 일반 데이터라벨러를 통해 구축할 수 없거나 저작권 문제로 확보하기 어려운 데이터셋으로 구성됐다. 셀렉트스타는 구매 기업 요청에 따라 데이터를 가공하는 서비스를 별도로 제공하며 홈페이지를 통해 보유한 데이터를 AI 학습용으로 판매할 공급 기업을 모집 중이다. 셀렉트스타는 인공지능 학습에 필요한 데이터를 공급하는 플랫폼 기업이다. 회사 측은 "대규모 언어 모델(LLM) 등장과 함께 저작권 걱정 없는 대규모 학습 데이터에 대한 큰 수요를 발견했다"며 사업 배경을 밝혔다. AI 도입을 위한 기술 장벽이 낮아지면서 서비스 개발을 위한 고품질 데이터가 더욱 중요해졌다는 설명이다. 황민영 셀렉트스타
최근 마이크로소프트, 구글, 메타 등 빅테크 기업들은 생성 AI의 인프라 격인 파운데이션 모델 개발에 집중하는 반면, 스타트 업계는 이를 활용하거나 특정 영역의 생성 AI를 설계하여 신사업 모델로서의 가치가 크게 부각되고 있는 가운데, 산업교육연구소은 오는 4월 14일에 “생성 AI(Generative AI) 기술을 활용한 영역별 사업모델 세미나”를 온·오프라인 동시 개최한다고 밝혔다. 이번 세미나에서는 생성 AI 기술 패러다임 및 활용 연구 현황과 관련 법제도 현황 및 저작권 문제를 시작으로 유력 스타트업 5개 회사의 AI 학습 데이터 영역, 텍스트 영역, 음악 영역, 영상 영역, 이미지 영역 등 영역별로 기술 개발과 사업모델과 성공사례에 이르기까지 생성 AI의 영역별 사업모델의 제반 정보를 공유하는 시간을 갖게 된다. 세미나 주제는 △생성 AI (Generative AI) 기술 패러다임 소개와 활용 연구 현황 △생성 AI 관련 법제도 현황 및 저작권 문제와 분쟁 사례 △[AI 학습 데이터 영역] 씨앤에이아이社의 이미지, 동영상 합성 데이터 제작 생성 AI 기술 개발과 사업모델 및 성공사례 △[텍스트 영역] 아티피셜소사이어티社의 기업 업무지원 생성 AI 기