디플리 이수지 대표 인터뷰 AI 기술이 시각 인식을 넘어 청각 분야로 확장되는 추세다. 음성을 통한 상호작용이 일상화함에 따라, AI는 현대인의 일상 및 작업 환경을 효과적으로 변화시키고 있다. 디플리는 소리 기반 AI 기술을 통해 기존 산업의 효율성을 극대화하고 새로운 가치 창출을 목표로 삼았다. 이에 디플리 이수지 대표를 만나 회사의 창업 배경과 기술 발전 과정, 그리고 장기적인 로드맵에 대해 이야기 나눠봤다. 위험을 미연에 방지하는 ‘리슨 AI’ 디플리는 위험 감지와 제조 분야에서 소리 데이터를 활용한 AI 솔루션을 개발해 주목받았다. 디플리가 개발한 ‘리슨 AI’는 비명, 충돌음, 기계 소음 등의 패턴을 실시간으로 분석해 산업 현장과 공공 장소에서의 안전 문제를 해결하는 데 유의미한 성과를 거두고 있다. 또한, B2B 중심으로 AI를 활용한 예지 보전 시스템을 도입해 제조업계의 효율성과 안전성을 모두 잡고자 한다. 특히 리슨 AI는 단순히 소리의 크기나 진동을 감지하는 것을 넘어, 복잡한 환경에서 여러 소리의 특징을 분석하고 패턴을 인식해 실제 현장의 상황을 실시간으로 판단할 수 있다는 점에서 차별화한다. 이러한 기술력은 지하철, 대형 쇼핑몰, 제조업
지속적인 업데이트로 현재 총 239명 AI 음성 서비스하고 있어 코난테크놀로지의 인공지능 성우 ‘코난보이스’가 3D캐릭터를 활용한 콘텐츠 수요증가에 따라 서비스 업데이트를 단행했다. 22년 론칭된 코난보이스는 간편하게 사용할 수 있는 AI 3D 콘텐츠 제작 서비스로, 음성합성에서 출발해 현재는 영상 콘텐츠까지 원스톱 제작 가능하다. 경쟁사 대비 33배 빠른 속도 및 고품질의 음성이 특징이며 지속적인 업데이트를 통해 현재 총 239명의 AI 음성을 서비스하고 있다. 특히 TTS(Text to Speech) 서비스 중 최초로 3D캐릭터 자동제작 기능을 선보였다. 스크립트만 입력하면 AI 캐릭터가 입 모양을 맞춰 자동으로 더빙해주며, 본인이 원하는 3D 캐릭터까지 개인화해 각종 교육 콘텐츠를 손쉽게 만들어낸다. 코난보이스는 이번 개편을 통해 연간 요금제를 정식 출시하고, 커스터마이징 배경화면 제작기능을 새롭게 내놓았다. 연간 요금제는 기존 월간 요금제 대비 최대 30%까지 할인된 금액으로 서비스가 제공된다. 또한, 사용자가 원하는 영상, 이미지, PPT 등을 업로드하면 즉시 배경화면으로 반영된다. 교육 콘텐츠 제작을 위해 PPT 강의자료를 삽입할 경우, 대본은 자
셀바스AI가 음성 합성 솔루션 ‘Selvy deepTTS’가 지자체 및 공공기관에 확대 공급돼 다양한 안내방송 서비스에 적용되고 있다고 24일 밝혔다. 지자체 및 공공기관 내 안내방송 등에 USS(Unit Selection Synthesis) 방식 음성 합성 솔루션을 사용하던 고객들이 더 자연스러운 보이스를 원하는 경우, ‘Selvy deepTTS’로 전환하는 사례가 증가하고 있다. 셀바스AI의 Selvy deepTTS는 딥러닝 기반 음성 합성 솔루션이다. 기존 USS 방식의 음성 합성 솔루션은 성우를 대체하여 안내방송을 제작할 수 있어 시간과 비용을 절감했으나, 다소 어색하고 딱딱한 목소리에 대한 아쉬움이 있었다. 이를 보완하기 위해 등장한 Selvy deepTTS는 인공지능 기술로 사람의 호흡, 억양, 감성 등 다양한 음성 요소를 정교하게 모델링하여 구현해 사람처럼 자연스럽고 유창한 합성 음성 생성이 가능하여 업계에 빠른 속도로 확산 중이다. Selvy deepTTS는 딥러닝 기반의 인공지능 솔루션이지만, 고가의 그래픽처리장치 장비 없이 중앙처리장치 환경에서도 높은 성능을 내도록 최적화되었다. 또한 윈도우 PC나 리눅스 시스템에서 활용이 가능하며, ‘자연
美 저작권법, 유명인 권리 보호에 집중된 반면 개인 목소리가 복제되는 경우는 도외시 텍스트, 이미지, 음성을 넘나드는 생성형 인공지능(AI)의 발달이 목소리가 무기인 성우의 활동 영역까지 위협하고 있다. 24일(현지시간) 미국 일간 워싱턴포스트(WP)에 따르면, 아일랜드 성우 레미 미셸 클라크는 올해 1월 한 문자-음성 변환 웹사이트에서 '올리비아'라는 가상의 인물이 자신과 똑같은 말씨와 목소리를 내는 걸 발견했다. 이 웹사이트는 올리비아가 오디오북에 최적화한 깊고 차분한 목소리를 갖고 있다고 홍보하고 있었다. 올리비아의 목소리를 직접 들어 본 클라크는 WP에 "당신의 목소리가 바뀌고 조작된 것을 보는 건 너무 기괴한 일"이라고 불쾌감을 드러냈다. 생성형 AI 프로그램이 섬뜩할 정도의 정확도로 사람의 목소리를 구현해내면서, 오디오북이나 비디오 게임, 광고에 등장하는 이름 없는 성우들의 일자리가 위협받고 있다. 목소리는 알려졌지만, 그에 대한 권한을 행사할 만큼 힘이 없기 때문이다. WP는 AI가 만들어내는 음성, 텍스트 등은 저작권 조항에서 다뤄진 적이 없어 성우들이 법적 보호를 받기도 어렵다고 지적했다. 회사와 성우 간 계약 체결 시 사측이 성우의 목소리를
웨인힐스브라이언트A.I(이하 웨인힐스)가 미국 라스베이거스에서 열리는 세계 최대 가전·IT 전시회 ‘CES 2023’에 참가해 한층 진화한 영상 생성 AI 기술과 관련 솔루션을 선보인다. 올해 세 번째로 CES에 참가하는 웨인힐스는 더욱 강화된 TTV(Text To Video), STV(Speech To Video) 서비스를 공개한다. TTV, STV는 머신러닝과 자연어처리 알고리즘을 기반으로 사용자가 입력한 텍스트 또는 음성 데이터를 요약해 영상으로 변환하는 생성 AI 기술이다. 이 기술은 금융 상품 약관이나 보험 상품 설명서 등 빠르게 파악하기 어려운 방대한 내용을 직관적인 영상 콘텐츠로 제공해 데이터를 해석하는 피로도를 낮춰준다. 이 기술로 웨인힐스는 지난해 1월 열린 ‘CES 2022’에서 혁신상을 받았다. 이번 행사에서 웨인힐스는 자사 부스에 이커머스 상품 상세 페이지 및 리뷰, 뉴스 기사 원문 등을 TTV로 변환한 영상을 전시한다. 또 서비스 개발자의 TTV 시연을 통해 텍스트가 영상으로 변환되는 과정을 상세히 소개한다. 행사 기간 웨인힐스는 불필요한 인쇄물을 줄이고, 자원 절약에 동참하고자 QR코드로 홍보물을 대신한다. 부스 입구에 비치된 QR코
실제 아나운서 데이터 기반으로 합성된 가상 캐릭터가 딥러닝으로 지속 학습 딜라이브는 오늘 인공지능(AI) 아나운서 '로아'를 이달 3일 주말 권역 뉴스를 시작으로 시청자에게 소개한다고 밝혔다. 로아(LoA)는 로컬 아나운서의 줄임말로, 딜라이브는 업계에서 처음으로 AI 아나운서의 기획부터 제작까지 모든 과정에 참여했다. 로아는 실제 아나운서의 영상 및 음성 데이터를 기반으로 가상의 캐릭터로 합성되고, 딥러닝 인공기술을 통해 지속해서 학습한다. 딜라이브는 클라우드 방식을 적용, AI 아나운서를 활용한 다양한 프로그램을 언제 어디서나 제작할 수 있는 환경을 제공하는 운영 시스템도 구축했다. 아울러 AI 아나운서가 일정 기간 학습만 거치면 바로 현장에 투입할 수 있다는 장점을 활용해 추후 다양한 프로그램으로 확대 적용할 계획이다. 딜라이브는 이 밖에도 내년 온에어를 목표로 AI 아나운서를 활용한 신규 프로그램 'AI 유튜브 리포팅'(가칭)도 준비하고 있다. 유튜브 콘텐츠와 연계한 AI 가상현실 프로그램으로 시청자들에게 맛집이나 여가시설 등 지역의 문화, 관광 정보를 제공한다는 콘셉트로 제작될 예정이다. 또한, 로아 외에도 광고 모델 및 콜센터 상담원 등의 AI 휴
공공, 의료, 게임, 엔터테인먼트 등 다양한 분야에서 활용...사업 역량 강화 셀바스AI는 2021년 연결기준 매출액이 전년 대비 40% 증가한 486억 원을 기록하여 역대 최대 실적을 달성했다고 공시를 통해 밝혔다. 영업이익은 56억 원으로 흑자 전환에 성공했다. 별도 기준 매출액 역시 호실적을 기록했다. 지난해 별도 기준 매출액은 195억 원으로 전년 대비 43% 증가했으며, 영업이익도 26억 원을 달성하여 흑자 전환했다. 셀바스AI는 음성인식과 음성합성 등 HCI뿐만 아니라 에듀테크, 헬스케어 등 AI 융합 사업의 고른 성장이 실적을 견인했다고 전했다. 회사 측에 따르면 금융, 교육, 헬스케어 등 다양한 산업에서의 디지털 트랜스포메이션이 가속화됨에 따라 HCI 기술은 물론 AI 융합 제품 수요가 지속해서 증가하고 있으며, 관련 매출 역시 지난해 대비 2배 이상 성장했다. 셀바스AI는 향후 실적 흐름이 긍정적일 것이라고 평가했다. 회사의 음성 기술은 국내 최고의 음성 인식률로 언택트 스토어, 금융권 컨택센터, 상담 및 조사가 필요한 공공·의료 분야를 넘어 게임, 엔터테인먼트 등 다양한 분야에서 활용되고 있다. 최근에는 대우조선해양 스마트 선박에 다자 간
헬로티 함수미 기자 | 코어에이아이와 엔비디아는 기업을 위한 대화형 AI 기반 플랫폼 및 솔루션의 혁신을 가속화하기 위해 협력한다. 이를 위해 코어에이아이는 엔비디아로부터 추가 투자를 받아 시리즈 C 펀딩 라운드를 연장해 총 7350만 달러를 확보했다. 디지털 혁신을 통한 고객의 참여 및 지원 여부가 글로벌 비즈니스 경영에 점점 더 중요해지고 있다. 고객 센터는 긴 대기 시간, 과부하 된 상담원, 상황별 부정확한 응답으로 인해 발신자 이탈이 증가하고 있어, 결과적으로 전반적인 고객 경험을 저하하고 만족도 및 고객 경험 또는 CX점수에 부정적인 영향을 미치고 있다. 일반적으로 신규 고객의 확보가 기존 고객을 유지하는 것보다 5배 이상 많은 비용이 투자되는 상황에서 상당한 고객 이탈로 이어질 수 있다는 점에서 주목해야 한다. 코어에이아이는 고객 이탈 문제를 해결하고 고객 및 고객 센터 상담사 경험을 최적화하기 위해 엔비디아와 협력한다. 코어에이아이의 대화형 인공지능 서비스와 엔비디아의 대화형 AI프레임워크인 리바가 통합된다. 리바는 음성 인식 정확성을 높이기 위해 10억 페이지 이상의 텍스트, 6만 시간 이상의 음성 데이터를 학습해 왔다. 코어에이아이와의 통합을