아마존웹서비스(Amazon Web Services, 이하 AWS)는 AWS 리인벤트(AWS re:Invent)에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS 클라우드를 기반으로 암 진단과 치료를 위한 새로운 병리학 기반 모델(FM)을 개발했다고 발표했다.
병리학 기반 모델인 엑사원패스(EXAONEPath)는 암 환자의 조직병리 이미지를 안전하게 분석해 유전자 검사 시간을 기존 2주에서 1분 미만으로 단축함으로써 의료진의 치료 속도와 효과를 개선할 수 있도록 돕는다. 엑사원패스는 이미지 패치를 정확하게 분류하는 데 있어 여섯 가지 벤치마크에서 평균 86.1%의 정확도를 달성했으며, 이는 훨씬 더 큰 데이터셋으로 학습된 다른 주요 병리 기반 모델들과 견줄 만한 수준이다.
AWS를 통해 LG AI연구원은 테라바이트 단위의 데이터를 1시간 이내로 클라우드에 전송, 모델 학습 시간을 60일에서 1주일로 단축시켰으며 이를 통해 엑사원패스의 암 진단 및 검출 성능을 향상시켰다. 또한 LG AI연구원은 AWS를 활용해 데이터 관리 및 인프라 비용을 약 35% 절감하고 데이터 준비 시간을 95% 단축할 수 있었다.
LG AI연구원 이화영 상무는 “AWS로 AI 연구를 가속화해 접근이 용이하고 신속한 암 검진을 현실화가 가능할 것”이라며 “AWS를 활용해 방대한 데이터셋에서 병리학 모델을 더 빠르고 안전하며 비용 효율적으로 학습시킬 수 있었다”고 전했다.
이어 “엑사원패스의 향상된 데이터 처리 기능은 더 개인화되고 효율적인 암 치료를 제공해 환자의 건강을 개선할 수 있도록 도와줄 것”이라며 “엑사원패스는 전 세계적으로 암 진단 및 치료 방식을 혁신할 수 있는 잠재력을 가지고 있다”고 강조했다.
LG AI연구원은 아마존 세이지메이커를 활용해 2억8500만 개의 데이터 포인트와 3만5000개 이상의 고해상도 조직 샘플 이미지를 사용, 8개월 만에 대규모 엑사원패스 모델을 학습하고 배포했다. 방대한 데이터셋으로 AI 모델을 처리하고 학습하기 위해서는 막대한 스토리지, 고속 데이터 전송 및 컴퓨팅 성능이 필요하다. AWS와 엔비디아 GPU를 통해 LG AI연구원은 딥 러닝 워크로드의 학습과 추론 속도를 가속화하고 있다.
LG AI연구원은 연구에 핵심적인 대용량 데이터를 저장하고 검색하는 데 아마존 S3를 활용한다. 러스트용 아마존 FSx는 밀리초 미만의 지연 시간과 초당 수백 기가바이트의 처리량을 제공해 대규모 데이터셋에 대한 빠른 접근이 필요한 애플리케이션에 필수적이다. 이 고성능 파일 및 스토리지 시스템은 병렬 데이터 처리와 분석을 가능하게 해 인사이트를 얻는 데 필요한 시간을 크게 단축한다.
댄 시런 AWS 헬스케어 및 생명 과학 부문 총괄 매니저는 “헬스케어 업계는 AWS의 AI를 통해 진단을 가속화하고 환자들을 더 빠르게 치료하는 데 있어 빠른 진전을 보이고 있다”며 “AWS를 통해 LG AI연구원은 엑사원패스를 전례 없는 규모로 개발 및 활용할 수 있게 돼 데이터 처리와 모델 훈련 시간을 단축하고 정확도를 개선할 수 있었다”고 말했다.
엑사원패스는 아마존 세이지메이커와 러스트용 아마존 FSx를 기반으로 구축된 LG A연구원의 3000억 개의 파라미터를 보유한 멀티모달 기반 모델 엑사원(EXAONE) 중 일부다. LG AI연구원은 추가 병리 이미지를 활용해 더 많은 유형의 암을 진단할 수 있도록 학습시켜 엑사원패스를 지속적으로 업데이트하고 개선해 나갈 예정이다.
헬로티 이창현 기자 |