AI 학습 데이터의 신뢰성을 높이기 위한 신원 인증 체계가 온체인 AI 데이터 라벨링 플랫폼에 도입된다. 아르고스 아이덴티티가 딥컨과 솔루션 공급 계약을 체결하 딥컨이 운영하는 분산형 AI 데이터 라벨링 플랫폼 SOIAA의 인증 단계에 ‘ID check’ 기반 KYC를 제공한다고 밝혔다. 이번 협력은 SOIAA에서 생성되는 데이터가 AI 학습 데이터로 활용되는 만큼 해당 데이터가 실제 사람의 활동에 의해 생성됐음을 입증하고 데이터의 신뢰성을 확보하기 위한 목적에서 추진됐다. 글로벌 사용자 기반의 데이터 생태계에서 데이터 기여자에 대한 공정한 보상 구조를 구축하는 데에도 초점이 맞춰졌다. SOIAA는 영상·이미지·텍스트·사운드 등 다양한 콘텐츠를 소비하고 상호작용하는 과정에서 발생하는 이용자 활동 데이터를 AI 학습 데이터로 활용하고 이에 대한 보상을 제공하는 ‘놀이형 데이터 라벨링’ 구조의 플랫폼이다. 이러한 구조 특성상 데이터의 무결성과 출처 신뢰성을 담보하기 위해 실제 사람이 수행한 활동인지 검증하는 인증 절차가 필수 요소로 작용한다. 딥컨은 글로벌 서비스를 지향하는 SOIAA의 특성을 고려해 다양한 국가의 사용자를 안정적으로 인증할 수 있는 기술을 검토
AI 학습 데이터 플랫폼 셀렉트스타는 29일 인공지능 학습 데이터 총판 사업을 본격화한다고 밝혔다. 데이터 저작권자와 협의를 거쳐 도서, 이미지, 영상, 대화 등 고품질 데이터를 AI 기업에 유통 및 판매한다는 내용이다. 셀렉트스타가 공개한 데이터셋 카탈로그에는 ▲법률·생활·금융·건강 등 전문가 질의 응답 ▲전문 분야 도서 ▲글로벌 이미지 플랫폼 제휴 사진·일러스트·영상 ▲다국어 일상 대화 및 번역 데이터셋 ▲언리얼 엔진 기반 합성 데이터 등이 포함돼 있다. 카탈로그 대부분이 일반 데이터라벨러를 통해 구축할 수 없거나 저작권 문제로 확보하기 어려운 데이터셋으로 구성됐다. 셀렉트스타는 구매 기업 요청에 따라 데이터를 가공하는 서비스를 별도로 제공하며 홈페이지를 통해 보유한 데이터를 AI 학습용으로 판매할 공급 기업을 모집 중이다. 셀렉트스타는 인공지능 학습에 필요한 데이터를 공급하는 플랫폼 기업이다. 회사 측은 "대규모 언어 모델(LLM) 등장과 함께 저작권 걱정 없는 대규모 학습 데이터에 대한 큰 수요를 발견했다"며 사업 배경을 밝혔다. AI 도입을 위한 기술 장벽이 낮아지면서 서비스 개발을 위한 고품질 데이터가 더욱 중요해졌다는 설명이다. 황민영 셀렉트스타
최근 마이크로소프트, 구글, 메타 등 빅테크 기업들은 생성 AI의 인프라 격인 파운데이션 모델 개발에 집중하는 반면, 스타트 업계는 이를 활용하거나 특정 영역의 생성 AI를 설계하여 신사업 모델로서의 가치가 크게 부각되고 있는 가운데, 산업교육연구소은 오는 4월 14일에 “생성 AI(Generative AI) 기술을 활용한 영역별 사업모델 세미나”를 온·오프라인 동시 개최한다고 밝혔다. 이번 세미나에서는 생성 AI 기술 패러다임 및 활용 연구 현황과 관련 법제도 현황 및 저작권 문제를 시작으로 유력 스타트업 5개 회사의 AI 학습 데이터 영역, 텍스트 영역, 음악 영역, 영상 영역, 이미지 영역 등 영역별로 기술 개발과 사업모델과 성공사례에 이르기까지 생성 AI의 영역별 사업모델의 제반 정보를 공유하는 시간을 갖게 된다. 세미나 주제는 △생성 AI (Generative AI) 기술 패러다임 소개와 활용 연구 현황 △생성 AI 관련 법제도 현황 및 저작권 문제와 분쟁 사례 △[AI 학습 데이터 영역] 씨앤에이아이社의 이미지, 동영상 합성 데이터 제작 생성 AI 기술 개발과 사업모델 및 성공사례 △[텍스트 영역] 아티피셜소사이어티社의 기업 업무지원 생성 AI 기