딥브레인AI는 서울사이버대학교와 ‘AI 교수’ 개발을 위한 업무협약을 체결했다고 9일 밝혔다. 체결식은 지난 4일 강남구에 위치한 딥브레인AI 사옥에서 진행됐다. 현장에는 이정수 딥브레인AI 사업개발그룹 이사와 김시원 서울사이버대학교 콘텐츠팀 처장 등 양사 주요 관계자들이 참석했다. 이번 협약을 통해 딥브레인AI와 서울사이버대학교는 온라인 강의 콘텐츠 개발의 효율성과 유연성을 확보하고, AI를 활용한 교육 프로그램 혁신에 박차를 가한다. 이를 기반으로 AI 시대를 선도하는 교육 환경의 디지털전환과 에듀테크 산업의 고도화를 이끌어간다는 포부다. 딥브레인AI는 서울사이버대학교 측에서 제공하는 영상, 음성 데이터를 기반으로 음성합성과 영상합성 등이 융합된 딥러닝 기반 AI 휴먼 기술을 활용해 서울사이버대학교의 AI 교수 10명과 AI 조교 3명을 개발한다. 립싱크 기술을 적용해 실제 사람이 이야기하는 것처럼 자연스러운 입모양을 구현하고, TTS(AI 음성 합성 기술)를 활용해 한국어, 영어, 러시아어, 베트남어 등 다양한 언어를 구사할 수 있도록 완성한다. 또한 AI 영상 합성 플랫폼 ‘AI 스튜디오스(AI Studios)’를 제공해 AI 교수를 활용한 콘텐츠를
코난테크놀로지가 2일 사내 임직원을 대상으로 AI 기술 세미나를 개최했다. 이번 세미나는 ‘dtrain for Android’를 주제로 열렸다. dtrain은 코난테크놀로지 100% 자체기술로 개발된 AI 프레임워크다. 지난 2021년 과학기술정보통신부의 ‘차세대 AI 연구개발에 활용 가능한 유연한 딥러닝 프레임워크 기술 개발’ 과제로 시작해 23년 1월 연구 개발을 마쳤으며, 현재 국방 분야 AI 과제 대상 호환성 테스트를 진행하고 있다. 텐서플로우와 파이토치와 달리 순수 국내기술로 개발된 만큼 높은 보안성을 강점으로 국방 안보 분야에 최신 edge AI 기술을 접목할 계획이다. 세미나는 윤덕호 비전AI연구소장이 발표했다. 자사의 STT, LLM, TTS 모델을 dtrain을 통해 안드로이드 기기에 적용한 연구결과를 소개하고, 후속 연구방향 안내 및 질의응답 순으로 진행됐다. 시연은 안드로이드 운영체제를 탑재한 오렌지파이에서 구현된 dtrain-edge Android 시제품을 통해 선보였다. 코난테크놀로지는 최근 자사의 제품군을 갤럭시S24에도 탑재하며 퀄컴의 저전력 AI칩과 같은 엣지 컴퓨팅에서도 합리적으로 운영 가능한 온디바이스 AI 개발에 속도를 내고
자동으로 음성 인식된 한국어를 실시간 번역 후 상대방에게 영어 음성으로 제공 코난테크놀로지가 스마트폰에 자체 개발 STT와 TTS, LLM이 탑재된 온디바이스 AI 기술력을 공개했다. 14일 코난테크놀로지는 공식 유튜브채널에 ‘코난 온디바이스’라는 타이틀로 데모영상을 업로드했다. 코난 온디바이스 데모는 삼성전자의 갤럭시S24 울트라 모델에서 실시했다. 마이크 버튼을 탭해 한국어로 말하면 자동으로 음성이 인식되고, 실시간 번역 후 상대방에게 영어 음성으로 제공된다. 사용자가 말한 내용을 번역하여 상대방 언어의 음성으로 들려주고, 사용자의 언어와 상대방의 언어 번역 결과가 스마트폰 화면에 대화 창으로 표시되는 방식이다. 현재 한국어와 영어 외에도 향후 업데이트를 통해 지원 언어를 추가할 계획이다. 음성인식은 기존의 챗GPT에서도 가능했지만 여기에 음성합성 기능이 추가됐고, 네트워크 연결 없이 디바이스 자체에서 사람의 말을 인식하고, 상대방 언어로 번역해서 말 해주는 과정이 한번에 AI를 통해 처리되는게 특징이다. 또한 모바일 기기 자체의 CPU만 사용하기에 저렴한 가격으로 각종 엣지 디바이스에서 효율적으로 이용할 수 있다. 코난테크놀로지 음성기술의 핵심경쟁력은
KT가 소상공인을 위한 서비스 'AI링고전화' 패키지를 새롭게 선보인다고 22일 밝혔다. AI링고전화는 매장으로 걸려오는 문의 전화부터 가게 홍보, 고객 관리까지 소상공인들의 고충을 한 번에 해결할 수 있는 패키지 상품이다. 이 서비스를 이용하면 매장 전화 연결 시 녹음된 음성으로 영업시간·장소안내·이벤트 등의 내용을 홍보할 수 있는 '링고비즈플러스'와 바쁜 시간 걸려온 전화를 대신 받고 놓친 전화는 메모해주는 'AI 통화비서 라이트' 서비스를 패키지로 이용할 수 있다. AI링고전화는 셀프 TTS(문자→음성변환) 기술을 통해 소상공인이 원하는 내용을 음성 통화 연결음으로 직접 제작할 수 있다. 또한 최초 가입 시 실제 성우가 녹음하는 유료 상품을 음원 3개까지 무료로 제공해 소상공인 업종과 니즈에 맞게 이용할 수 있도록 준비했다. KT는 AI링고전화와 같은 고객 맞춤형 서비스를 통해 소상공인들에게 더 많은 고객 유치와 매출 향상에 도움을 줄 것으로 기대하고 있다. KT Customer사업본부장 김영걸 상무는 "소상공인들이 비즈니스에서 성공하기 위해서는 가게 홍보와 응대를 위한 신속하고 정확한 안내가 필요하다"며 "AI링고전화가 바쁜 소상공인들에게 많은 도움이
AI 휴먼 활용, 글로벌 기업 국내외 사업장에 제공할 교육 콘텐츠 제작 시작 이스트소프트가 LG에너지솔루션과 AI 휴먼을 활용한 교육 콘텐츠 공급 계약을 체결했다고 24일 밝혔다. 이번 계약으로 이스트소프트는 LG에너지솔루션의 국내 사업장, 해외 법인, 지사 등에 제공할 교육 콘텐츠를 공급한다. 양사는 이스트소프트의 고도화된 AI 휴먼과 이를 활용한 영상 제작 솔루션이 글로벌 기업인 LG에너지솔루션의 교육 콘텐츠 제작 효율을 극대화하고 더 나아가 임직원의 교육 환경을 개선하는데 크게 기여할 것으로 판단했다. 이스트소프트의 AI 휴먼 영상 제작 솔루션 ‘AI 스튜디오 페르소’는 기업의 교육 콘텐츠 제작 과정을 대폭 줄여준다. 별도의 촬영 없이 사용자가 텍스트를 입력하거나 교육용 음성, 워드, PPT 파일을 업로드하는 것 만으로 AI 휴먼이 진행하는 교육 영상을 즉각적으로 생성해 낼 수 있기 때문이다. 이스트소프트는 휴넷, YBM, 클래스101 등 국내 주요 교육 기업들에 ‘AI 스튜디오 페르소’를 활용한 교육 서비스를 제공하고 있다. 고품질 AI 휴먼의 활용도도 매우 높다. 현존 최고 화질인 8K까지 대응할 수 있는 AI 휴먼이 교육의 몰입도를 높이고, 110
"관공서, 통신사 등 맞춤형 지원해 딥페이크 범죄 피해 예방 앞장" 딥브레인AI는 딥페이크 탐지 솔루션을 고도화했다고 3일 밝혔다. 조작된 영상 검출은 물론 이미지, 음성까지 탐지 범위를 확대했다. 딥페이크(Deepfake)란 AI를 활용해 특정인의 얼굴과 목소리, 행동까지 그대로 재현한 위조 콘텐츠를 일컫는다. 스마트폰 앱으로 딥페이크 영상을 쉽게 만들 수 있는 등 기술 장벽이 낮아지며 사회에 많은 혼란을 야기하고 있다. 다가오는 미국 대선을 앞두고 가짜 뉴스, 불법 음란물 등 범죄에 악용되는 사례가 지속적으로 늘고 있는 상황이다. 딥브레인AI는 딥러닝 기반 영상·음성 합성과 자연어 처리 기술을 융합한 AI 휴먼 솔루션과 글로벌 수준의 생성형 AI 아바타 제작 솔루션 등 우수한 AI 기술을 바탕으로 완성도 높은 딥페이크 탐지 솔루션을 선보였다. 세부적으로는 ▲종합 탐지 모델 ▲특정 인물 탐지 모델 ▲음성 탐지 모델로 구성된다. 종합 탐지 모델은 합성곱 신경망(CNN, Convolution Neural Network)과 구글의 자연어 처리 모델인 트랜스포머를 기반으로 설계됐다. 세상에 존재하지 않는 가상 인간의 얼굴을 제작하는 페이스 제너레이션과 원하는 얼굴
자사 AI 휴먼 서비스 'AI 스튜디오 페르소' 탑재해 글로벌 경쟁력 강화 인공지능(AI) 서비스 기업 이스트소프트가 AI 휴먼에 110여개국 75종 언어, 450여명의 목소리를 구현했다. 이스트소프트는 아리랑TV의 대표 앵커로 활약한 데빈을 모델로 다국어 발화가 가능한 AI 휴먼을 출시했다면서 19일 이같이 밝혔다. 구체적으로는 인물의 외모, 발화 능력, 목소리, 특유의 말투·동작을 그대로 복제해 생성하는 이스트소프트의 AI 클론(AI Clone) 기술 STF(Text-To-Speech)에 마이크로소프트(MS)의 음성합성 기술인 TTS(Text-To-Speech)를 접목해 AI 휴먼의 다국어 발화와 다양한 목소리를 구현한 것이다. 이스트소프트는 "데빈을 회사의 인간 AI 영상 제작 설루션인 'AI 스튜디오 페르소'에 탑재해 서비스를 제공한다"며 "다국어 발화에서는 같은 언어라도 사용 국가 간 다르게 표현되는 뉘앙스까지 표현해낸다"고 소개했다. AI 휴먼 앵커 데빈은 한층 더 완성도 높은 서비스를 제공하기 위해 글로벌 시장에 통용되는 수준의 영어를 발화할 수 있도록 제작했다. AI 서비스 품질 대부분은 데이터 질에 크게 영향을 받는데, 이스트소프트는 아리랑T
셀바스AI가 국내 다수의 로봇 기업에 음성기술 공급을 확대하며 '대화형 AI 음성 로봇' 사업에 속도를 내고 있다. 셀바스AI는 로봇 전문기업 클로봇, 로보케어에 음성합성(TTS)을 공급했다고 2일 밝혔다. 셀바스AI의 음성합성 'Selvy TTS'는 클로봇과 로보케어의 자율주행 안내로봇, 데일리케어 로봇, 인지훈련 로봇 등에 적용됐다. 한국어 뿐 아니라 영어, 중국어, 일본어 등 다국어 음성합성이 공급돼 다양한 국적의 사용자를 위해 서비스 중이다. 셀바스AI는 음성합성 공급을 시작으로 음성인식과 GPT를 응용한 '대화형 AI 음성 서비스' 등을 확대할 계획이다. B2B 로봇 서비스 기업 클로봇의 자율주행 안내로봇은 병원, 박물관, 백화점 등 각 기관의 사용 환경에 맞춘 서비스를 제공 중이다. 셀바스AI의 음성합성 등 음성기술을 통해 박물관 내 전시해설(도슨트) 서비스뿐 아니라 외국인 관광객을 위한 다국어 서비스도 제공 중이다. 로보케어 돌봄로봇의 경우 실버 세대용 인지훈련 로봇 '보미'와 일대일 이동형 인지훈련 데일리케어 로봇에 음성합성 기술이 적용되고 있다. 특히 보미 로봇은 이대목동병원 로봇인지치료센터 등에서 치매 위험이 있는 고령자를 대상으로 두뇌 향
미디어젠은 한국전자통신연구원(ETRI)의 연구 인력 현장 지원 프로그램을 통해 기존에 음성 스펙트럼 채널이 1개인 것을 보완해 RGB 3채널을 이용한 음성 스펙트럼을 개발했다고 21일 밝혔다. 현재 가장 널리 사용되는 음성 인식 특징은 '로그 멜 스펙트럼'이지만, 이 특징은 음성 신호의 다양한 생성 과정을 포함하지 못한다는 단점이 있다. 또 심층 학습망의 특성상 입력이 되는 특징이 다양한 음성의 특징적 요소를 각각 표현해줄 수 있어야 이를 바탕으로 더 지능적인 학습을 진행할 수 있다. 이에 따라 미디어젠은 ETRI 연구 인력 현장 지원 프로그램을 통해 음성 발성 모델을 활용, 분석된 성도 필터 정보와 신호 정보를 채널화함으로써 RGB 구성 요소를 갖는 컬러 스펙트럼을 개발했다. 일반적으로 성도 필터 정보는 음소를 표현하기에 적합하며 배경 잡음에 상대적으로 강인한 특성이 있고, 신호 정보는 음성 정보뿐만 아니라 발성 개인의 특성을 잘 표현해주는 특성이 있다. 컬러 스펙트럼에서는 이런 정보를 분석한 뒤 특징화해 음성 인식 시스템을 학습할 때 이를 심층 학습망에 알려줌으로써 인공지능이 음성 인식에 필요한 특징 정보를 선택하도록 도움을 준다. 이를 증명하기 위해 수
네이버클라우드, AI 엑스포서 클로바 스튜디오, 클로바 더빙, 클로바 OCR 선보여 네이버클라우드가 13일부터 15일까지 서울 코엑스에서 열린 ‘제5회 국제인공지능대전(AI EXPO KOREA 2022)’에서 ‘하이퍼클로바(HyperCLOVA)’를 기반으로 한 다양한 클라우드 서비스를 선보였다. 하이퍼클로바는 네이버가 자체 개발한 초거대 규모 AI다. 네이버클라우드는 하이퍼클로바를 활용한 ▲클로바 스튜디오(CLOVA Studio) ▲클로바 더빙(CLOVA Dubbing) ▲클로바 OCR(CLOVA OCR) 등 AI 서비스를 공개했다. ‘클로바 스튜디오’는 개발과 관련된 전문 지식이 없이도 AI의 적용 가능성을 탐색하고 나아가 실제 서비스에 적용해볼 수 있는 노 코드(No Code) AI 도구 플랫폼이다. ‘클로바 스튜디오’는 ▲자유롭게 AI를 실험해볼 수 있는 ‘플레이그라운드’, ▲다른 사용자들이 작업한 AI를 둘러보고 활용할 수 있는 ’익스플로러’ ▲사용자들끼리 의견과 질의응답을 나누는 ’포럼’ 공간으로 구성된다. ‘플레이그라운드’에서는 원하는 AI에 대한 간단한 설명과 몇 가지 예제를 자연어로 입력하기만 하면 맞춤 AI를 생성할 수 있다. 결과물이 API
우리은행은 AI상담봇과 AI챗봇 서비스를 포함한 ‘AI 상담 서비스’를 고도화해 확대 적용한다고 10일 밝혔다. 우리은행은 작년 4월부터 해당 서비스를 개발해 지난 12월 시범 운영을 시작했다. ‘AI 상담 서비스’는 STT(음성인식), TTS(음성합성), NLU(자연어이해) 등 AI 언어 기술이 융합된 서비스이며, AI상담봇은 음성 기반으로, AI챗봇은 문자(채팅)로 사람과 대화한다. ‘인바운드 AI상담봇’은 전화상담시 AI가 먼저 응대해 고객 문의 사항을 파악하여 전담직원을 연결해 주며 일부 단순 업무는 AI상담봇이 직접 안내한다. ‘아웃바운드 AI상담봇’은 기존 상담직원이 시나리오 기반으로 수행하던 업무를 수행하며, ▲해피콜 ▲연체지원 ▲고객만족도 설문 등 더 다양한 업무가 가능해 현재 하루 1만콜 이상을 처리한다. ‘AI챗봇’은 이번 고도화로 고객의 단순 문의 해결뿐만 아니라 고객정보 기반으로 맞춤형 답변을 제공하는 등 개인화 서비스가 가능해졌으며 UI/UX도 새롭게 갖추었다. 작년 말 시범 서비스 오픈 이후 이용자 수가 7배 이상 증가했으며, 대고객 응답률도 월등히 향상되었다. 이번 챗봇 고도화에는 각종 문서에서 정보를 찾아내는 인공지능 기술도 함께