테스트웍스는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2024년 초거대 AI 확산 생태계 조성 사업’ 중 멀티모달(이미지·비디오·오디오 등 데이터 동시 처리 기술) ‘트립체인 데이터’ 구축 사업의 주관 기업으로 선정됐다고 28일 밝혔다.
초거대 AI 확산 생태계 조성사업은 기존 ‘인공지능(AI) 학습용 데이터 구축사업’을 전환해 최근 국내외 AI 서비스 경쟁력의 관건이 되는 초거대 AI 데이터 구축·개방을 통해 AI 생태계를 조성하고 안전한 AI 일상화를 실현할 수 있도록 지원하는 것이 목적이다.
테스트웍스는 지난 5년간 ‘인공지능(AI) 학습용 데이터 구축사업’을 통해 약 20여 개에 달하는 과제를 수행해 왔다. 인도보행, 교통물류, 재난안전환경, 농축수산, 한국어-수어 등의 분야에서 대규모 데이터를 성공적으로 구축해 데이터 수집부터 가공 검증까지 관련 핵심 기술들을 턴키로 보유하고 있다.
테스트웍스가 주관기업으로 참여하는 트립체인 데이터 구축 사업에서 ‘트립체인’은 교통 이용자가 출발지에서 목적지에 도착하는데 까지 이동하는 전 과정에서 환승 및 환경을 포함한 전체 트립(이동)의 과정을 의미한다.
이번 사업에서는 특히 수요자 중심의 관점에서 음성 및 텍스트를 포함한 다양한 데이터 형태를 확보할 예정으로, 승용차와 대중교통 이용자를 구분해 통행에 대한 통합 데이터 수집 프로젝트를 진행한다. 이렇게 확보된 ‘승용차 이용자 개별 트립체인 데이터’와 ‘대중교통 이용자 종합 트립체인 데이터’는 초거대 AI 기술을 통한 수요자 중심의 안전한 개인 맞춤형 교통서비스를 지원하는데 활용될 수 있을 것으로 기대된다.
테스트웍스는 이번 과제 수행을 위해 크라우드-소싱 기반의 ‘에이아이웍스(aiworks)’ 플랫폼에서 트립체인 데이터 수집 참여자를 모집한다. 데이터 수집은 통행 거리, 시간, 지역 등의 공간적 수집 범위와 함께 통행 목적을 포함해 다양한 조건에 맞춰 진행된다.
이를 통해 확보된 원시데이터는 정보 확인과 유효성 검증 및 정제 과정을 거쳐 통합, 음성, 메타 및 생성형 데이터로 구성된다. 특히 개인별 특성과 공간적으로 산재되어 있는 트립체인 데이터의 특성을 감안해 앱기반의 수집 도구를 개발, 진행한다. 정확한 데이터 가공을 위해서는 교통 공학 및 어문 계열 관련 전공자들이 참여할 예정이다.
이렇게 구축된 데이터는 트립체인 데이터의 특성과 적합성 검토를 통해 AI 학습 모델을 선정, 검색 증강 생성 기술(RAG)을 활용해 개인 맞춤형 경로 안내 등의 챗봇에 활용될 계획이다.
윤석원 테스트웍스 대표는 “초거대 AI 확산 트립 데이터 구축사업은 교통 물류 산업의 혁신이라는 새로운 기회 발굴의 계기가 될 것”이라며 “이번 사업을 통해 국민들의 교통 안전을 실질적으로 강화하는 효과가 기대되며 이는 곧 AI에 대한 국민들의 안전 인식을 높여 궁극적으로 AI 시장의 확산에도 기여할 것”이라고 말했다.
헬로티 이창현 기자 |