일반뉴스 유니닥스, 헬스케어 sLLM 허깅페이스에 무료 공개
유니닥스가 자사의 인공지능 솔루션 ‘ezMyAIDoctor’에 활용된 헬스케어 sLLM(소형언어모델)을 허깅페이스에 무료로 공개했다고 18일 밝혔다. 이번에 공개된 sLLM은 유니닥스의 ezMyAIDoctor에서 사용되는 모델로, 인공지능산업융합사업단(AICA)의 AIDC-HPC 사업의 결과물이다. 이 모델은 NIA의 AI 허브에 공개된 ‘초거대 AI 헬스케어 질의응답 데이터’를 바탕으로 Meta의 LLaMA 3.1 모델을 추가로 사전 학습시키고, SFT 및 DPO 등 미세 조정을 거쳐 개발됐다. 이번 sLLM 개발에는 위키피디아를 비롯해 AI Hub에 공개된 2억 어절의 헬스케어 질의응답 데이터, 20억 어절의 한국어 성능이 개선된 초거대 AI 말뭉치, 약 5000어절에 달하는 의료 및 법률 전문 서적의 말뭉치 등이 포함됐다. MMLU 벤치 마크 중 의료 카테고리에 대해서 유니닥스 자체 테스트한 결과 기존 llama31_8b_instruct 모델 대비 벤치마크 점수가 상승했으며 문자열 생성 시 한글 및 의료용어 정확성이 증가함을 확인했다고 유니닥스는 전했다. 다만 공개된 데이터는 질병에 대한 이해를 돕기 위해 만들어진 것으로 질병의 정확한 진단과 치료방법을