배너
닫기
배너

LG 엑사원에 GPU 아닌 NPU...퓨리오사AI ‘레니게이드’ 전면 도입

URL복사

 

퓨리오사AI가 자사의 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 LG의 대규모 언어모델(LLM) ‘엑사원(EXAONE)’에 전면 도입했다고 22일 밝혔다. 이번 협업은 양사가 약 8개월에 걸쳐 진행한 성능 검증을 바탕으로 추진됐으며, 이를 통해 레니게이드는 GPU를 대체할 수 있는 현실적인 대안으로 주목받고 있다.

 

LG AI연구원은 엑사원 3.5 모델의 파일럿 환경에 레니게이드를 적용해 테스트한 결과, 전력 대비 성능에서 기존 GPU보다 약 2.25배 높은 효율을 확인했다. 특히 대규모 AI 모델 구동 시 GPU가 갖는 고질적인 전력 소모 문제를 해결하면서도 고성능 요건을 충족시켰다는 점에서 의미가 크다.

 

이번 사례는 대형 엔터프라이즈 AI 추론 환경에서 GPU 이외의 가속기가 실질적으로 도입된 첫 사례 중 하나로, 산업 전반에서 AI 인프라 다변화 가능성을 제시했다. 퓨리오사AI는 이를 통해 글로벌 기업을 대상으로 한 엔터프라이즈 레퍼런스를 확보하게 되었으며, 향후 대형 AI 프로젝트에 활용도를 확대할 수 있는 기반을 마련하게 됐다.

 

LG 측도 레니게이드의 실용성을 높이 평가했다. 전기정 LG AI연구원 프로덕트 유닛장은 “다양한 GPU 및 NPU를 검토한 결과 레니게이드는 높은 성능과 함께 인프라 총소유비용(TCO)을 크게 절감시켰다”며 “모델 지원 속도와 운용 편의성 면에서도 우수하다”고 밝혔다.

 

퓨리오사AI는 이번 협업을 계기로 엑사원 기반의 엔터프라이즈 전용 AI 솔루션 출시도 예고했다. 양사는 기업 환경에 최적화된 온프레미스 턴키 솔루션 ‘엑사원 AI 솔루션’을 공동 개발 중이며, 이를 통해 금융, 제조, 헬스케어 등 다양한 산업군에 맞춤형 생성형 AI 도입을 확대할 계획이다.

 

레니게이드는 엑사원 3.5 모델은 물론 향후 출시될 엑사원 4.0 모델도 지원할 예정이다. 5nm 공정 기반의 고성능 NPU로, FP8 기준 최대 512TFLOPS의 연산 능력과 48GB HBM3 메모리, 180W TDP를 갖춘 것이 특징이다. 자체 개발한 텐서 수축 프로세서(TCP) 아키텍처를 기반으로 멀티칩 추론을 지원하며, PyTorch 기반 vLLM과 호환되는 서빙 프레임워크 ‘FuriosaLLM’도 함께 제공된다.

 

레니게이드는 앞으로 LG 계열사의 AI 서비스에도 폭넓게 적용될 전망이다. 전자, 화학, 통신 분야를 포함해 LG AI연구원이 개발 중인 엔터프라이즈 AI 에이전트 ‘챗엑사원(ChatEXAONE)’의 외부 고객 서비스에도 활용될 예정이다.

 

퓨리오사AI 백준호 대표는 “엑사원은 한국형 파운데이션 모델로서 상징적인 위치를 확보해가고 있다”며 “자체 AI 반도체를 통해 고성능 AI 인프라를 주도적으로 설계하고 운용하려는 기업들에게 새로운 기준이 될 것”이라고 밝혔다.

 

헬로티 서재창 기자 |













배너

배너


배너


주요파트너/추천기업