한국전자통신연구원(ETRI)이 노년층의 음성 발화를 분석해 치매 전 단계인 경도인지장애 및 치매 고위험군을 선별하는 인공지능(AI) 기술을 개발했다. 이번 연구는 국가과학기술연구회의 지원을 받아 진행됐으며, 일상생활의 대화를 통해 입력되는 음성을 분석함으로써 퇴행성 뇌 기능 저하를 평가하고 예측하는 것을 목표로 한다.
음성 발화는 기억, 의도, 주의집중 등의 인지 기능과 음운, 통사, 의미 등의 언어 생성 기능, 호흡, 조음, 발성 등의 구어 운동 기능이 복합적으로 작용하는 과정이다. 이러한 발화 분석을 통해 경도인지장애 및 치매 환자에게서 나타나는 인지, 언어, 운동 능력의 저하를 조기에 판단하고 예측할 수 있다.
ETRI의 복합지능연구실은 음성처리 분야에서 축적된 AI 기술과 음성, 텍스트 및 영상 멀티모달 기술을 바탕으로 디지털 치료제 등 헬스케어 분야로 연구를 확장하고 있다. 연구진은 기존의 음성, 텍스트 분석 기술에 더해 세계 최초로 대형 언어 모델(LLM)을 결합한 알츠하이머 치매 예측 연구를 통해, 영국 에든버러 대학과 미국 카네기 멜론 대학에서 주최한 ADReSSo 챌린지 데이터셋에서 최고 성능을 달성했다.
연구진의 성과는 2024년 2월 ETRI 저널에 게재됐으며, 이 성과는 미국과 독일 등 다양한 업체로부터 상용화 가능성 문의를 받는 등 높은 관심을 끌었다. 또한 최근 각광받는 시각언어모델(VLM) 기술을 적용해 동일한 챌린지에서 최고 성능을 갱신한 바 있으며, 최우수 SCI 저널에도 논문을 제출한 상태다.
연구 결과를 바탕으로, 일상생활 대화 과제를 중심으로 한 음성 발화 입력을 통해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱 개발을 완료했다. 노년층, 특히 경도인지장애 및 치매 고위험군에서 흔히 나타나는 부정확한 발음, 사투리 발화 등의 분석 어려움을 극복하기 위해 축적된 음성 및 멀티모달 AI 기술을 활용했다.
이 앱은 노년층의 사용자 편의성과 정확도 개선에 주안점을 두고 개발되었으며, 한국전기연구원과 연계하여 노인복지센터 등에서 실증할 계획이다.
ETRI 복합지능연구실 강병옥 책임연구원은 “기존 보건소에 직접 방문하여 선별검사를 받는 방식에 비해, 스마트기기를 통한 대화 기반의 검사 방식은 지속적/주기적 모니터링이 가능하다는 장점이 있다”고 설명했다.
연구진은 해당 기술을 통해 많은 치매 고위험군 노년층이 조기에 경도인지장애 여부를 확인하고 초기부터 지속적인 관리를 통해 치매로 진행되는 것을 최대한 늦출 수 있도록 기대하고 있다.
이번 연구 성과는 AI와 의료 기술의 융합을 통해 치매 예방과 조기 진단의 새로운 길을 열었다는 평가를 받고 있으며, 향후 상용화를 통해 치매 치료를 위한 국가 및 사회적 비용 절감과 글로벌 디지털 치료제 시장에서도 큰 반향을 일으킬 것으로 전망된다.
헬로티 임근난 기자 |