플리토가 글로벌 AI 모델의 다국어 인식률 향상을 위해 ‘아랍어 음성 데이터 수집 프로젝트’를 시작했다. 이번 프로젝트는 음성인식 모델의 취약 언어로 꼽히는 아랍어의 낮은 인식률을 개선하고 실제 사용 환경을 반영한 고품질 학습 데이터를 구축하는 데 목적이 있다. 아랍어는 표준어인 Modern Standard Arabic 외에도 30개 이상의 방언이 존재하며 구어체에서는 표준어와 방언을 혼용하는 코드 스위칭 현상이 빈번하다. 이러한 언어적 특성으로 인해 AI 학습 데이터 구축 난이도가 높은 언어로 분류된다. 플리토는 방언 차이를 체계적으로 반영한 음성 데이터를 수집해 언어 자원 편차로 인한 AI 학습 한계를 개선한다는 방침이다. 플리토는 자사 모바일 애플리케이션의 음성 데이터 수집 기능 ‘아케이드(Arcade)’를 통해 아랍어 음성 데이터 수집 이벤트를 운영한다. 참여자가 제시된 문장을 읽고 발음을 녹음하면 AI 시스템이 이를 분석해 방언 유형을 자동 판별한다. 방언 유형이 불확실한 경우에는 추가 문장을 제시해 재참여를 유도하는 방식으로 데이터 정확도를 높인다. 업체는 글로벌 빅테크 기업의 다국어 음성 데이터 수요가 증가함에 따라 실제 프로젝트 요청이 확대되고
코난테크놀로지가 최신 생성형 AI 기반 음성인식 솔루션으로 국민건강보험공단의 스마트 회의록 작성 업무를 지원한다. 회사는 지난달 ‘코난 STT’를 건강보험 클라우드 표준 플랫폼 구축 사업 내 스마트 회의실에 공급하기로 확정했다. 이번 도입으로 공단은 회의 내용을 실시간으로 기록·정리하는 효율성을 높일 수 있을 것으로 기대된다. 코난 STT는 10만 시간 이상의 고품질 대규모 음성 데이터를 학습하고 최신 대규모 언어모델(LLM) 아키텍처를 적용해 성능을 향상시킨 것이 특징이다. 자체 한국어 다영역 성능 평가에서 95%대 문자인식률(Character Accuracy)을 기록했으며, 이는 동종 업계 최상위권 수준이다. 평가에는 Common Voice v19, TEDx KR, FLUERS, Zeroth Korean, AI-Hub 전문분야 심층인터뷰 등 5종의 공개 벤치마크와 함께 드라마, 인터넷 강의 음성 데이터를 포함한 총 7종의 데이터셋이 활용됐다. 이 과정에서 화자 특성과 주변 잡음 등 다양한 환경 요소를 반영해 신뢰성을 확보했다. 코난테크놀로지는 이번 공급을 계기로 공공기관뿐 아니라 다양한 산업군으로 생성형 AI 음성인식 솔루션 적용 범위를 넓힌다는 계획이다
기존 ACMI를 최신 AI 기반의 개선된 신규 체계로 전환 구축하고자 추진 코난테크놀로지가 앞선 기술력으로 국방의 AI 시스템 구축을 선도하고 있다. 코난테크놀로지는 13일 공군 전력지원체계사업단의 ‘AI 기반 ACMI 수집분석체계 구축 사업’의 우선협상자로 선정됐다. 사업비는 15억 원대며, 사업기간은 3개월간으로 올해 12월까지다. 이번 사업은 노후화된 기존의 공중전투기동훈련체계(Air Combat Maneuvering Instrumentation, 이하 ACMI)를 최신 AI 기반의 개선된 신규 체계로 전환 구축하고자 추진됐다. 이에 따라 공군의 항공기 및 전투기 훈련 과정에서 ACMI 임무데이터를 분류 및 구조화함으로써 조종사들의 공중전 훈련능력을 향상시키고, 나아가 AI 기반 모의비행훈련체계와 유·무인 복합전투체계 등 국방혁신 4.0 실현을 가속할 것으로 기대된다. 최신 STT 기술을 통해 조종사의 음성데이터를 변환하는 과업도 포함된다. 비행 훈련 중 지상통제소와 조종사간 음성교신내용이 녹음된 파일에 대해 AI 학습을 통해 그 내용을 문자데이터로 변환해주는 역할로서, 코난테크놀로지의 딥러닝 기반 음성인식 엔진이 도입된다. 김영섬 대표이사는 “AI 기