자사 AI 휴먼 서비스 'AI 스튜디오 페르소' 탑재해 글로벌 경쟁력 강화 인공지능(AI) 서비스 기업 이스트소프트가 AI 휴먼에 110여개국 75종 언어, 450여명의 목소리를 구현했다. 이스트소프트는 아리랑TV의 대표 앵커로 활약한 데빈을 모델로 다국어 발화가 가능한 AI 휴먼을 출시했다면서 19일 이같이 밝혔다. 구체적으로는 인물의 외모, 발화 능력, 목소리, 특유의 말투·동작을 그대로 복제해 생성하는 이스트소프트의 AI 클론(AI Clone) 기술 STF(Text-To-Speech)에 마이크로소프트(MS)의 음성합성 기술인 TTS(Text-To-Speech)를 접목해 AI 휴먼의 다국어 발화와 다양한 목소리를 구현한 것이다. 이스트소프트는 "데빈을 회사의 인간 AI 영상 제작 설루션인 'AI 스튜디오 페르소'에 탑재해 서비스를 제공한다"며 "다국어 발화에서는 같은 언어라도 사용 국가 간 다르게 표현되는 뉘앙스까지 표현해낸다"고 소개했다. AI 휴먼 앵커 데빈은 한층 더 완성도 높은 서비스를 제공하기 위해 글로벌 시장에 통용되는 수준의 영어를 발화할 수 있도록 제작했다. AI 서비스 품질 대부분은 데이터 질에 크게 영향을 받는데, 이스트소프트는 아리랑T
딥러닝 학습, AI 휴먼 솔루션 적용해 실제 아나운서 같은 발음, 모습 등 구현.. 완성도 up 딥브레인AI는 ‘기술연구소 4주년 MAX 프로젝트 시연회’에서 한국어, 영어 모두 구사 가능한 ‘AI 앵커’를 선보였다고 밝혔다. MAX 프로젝트 시연회는 아리랑 융합기술센터 기술연구소 발족 4주년을 맞이해 차세대 융합 방송 기술 인프라 구축 R&D로 추진해온 메타버스, AI, XR 프로젝트와 기업 공동 연구 수행 결과를 공유하고자 마련된 행사다. 이날 행사에서 딥브레인AI는 국내 방송 분야 최초로 한 문장 내 한국어와 영어 두 가지 언어를 모두 자연스럽게 구사하는 AI 앵커를 선보였다. 지난 CES2022에서 공개된 이후, 다국어 음성 합성 모델 연구로 고도화된 딥러닝 알고리즘을 개발과정을 거쳐 실제 방송에서도 상용화 가능하도록 완성도를 높였다. 아울러 음성 및 영상 합성, 자연어 처리, 음성 인식 기술 등 다양한 인공지능 기술을 기반으로 하는 AI 휴먼 솔루션을 적용해, 외모부터 목소리 톤, 억양, 입 모양, 감정 표현, 제스처 등까지 모델과 흡사한 완성도 높은 모습의 AI 앵커를 구현했다. 딥브레인AI는 기술검증 등 AI 앵커 상용화를 위한 기술 준비