퓨리오사AI가 자사의 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 LG의 대규모 언어모델(LLM) ‘엑사원(EXAONE)’에 전면 도입했다고 22일 밝혔다. 이번 협업은 양사가 약 8개월에 걸쳐 진행한 성능 검증을 바탕으로 추진됐으며, 이를 통해 레니게이드는 GPU를 대체할 수 있는 현실적인 대안으로 주목받고 있다. LG AI연구원은 엑사원 3.5 모델의 파일럿 환경에 레니게이드를 적용해 테스트한 결과, 전력 대비 성능에서 기존 GPU보다 약 2.25배 높은 효율을 확인했다. 특히 대규모 AI 모델 구동 시 GPU가 갖는 고질적인 전력 소모 문제를 해결하면서도 고성능 요건을 충족시켰다는 점에서 의미가 크다. 이번 사례는 대형 엔터프라이즈 AI 추론 환경에서 GPU 이외의 가속기가 실질적으로 도입된 첫 사례 중 하나로, 산업 전반에서 AI 인프라 다변화 가능성을 제시했다. 퓨리오사AI는 이를 통해 글로벌 기업을 대상으로 한 엔터프라이즈 레퍼런스를 확보하게 되었으며, 향후 대형 AI 프로젝트에 활용도를 확대할 수 있는 기반을 마련하게 됐다. LG 측도 레니게이드의 실용성을 높이 평가했다. 전기정 LG AI연구원 프로덕트 유닛장은 “다양한 GPU 및 NPU
RNGD 기반 인프라 접근 개방 및 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공 예정 퓨리오사AI가 자체 개발한 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 마이크로소프트 애저 마켓플레이스에 공식 등록하며, 글로벌 시장 확대에 본격 시동을 걸었다. 이번 조치는 LLM과 멀티모달 AI 추론 환경에 최적화된 고성능 인프라를 세계 수백만 애저 고객이 즉시 활용할 수 있는 길을 열었다는 점에서 주목된다. 레니게이드는 클라우드 중심 환경은 물론 온프레미스와 하이브리드 인프라에도 유연하게 적용 가능한 데이터센터용 AI 가속기로, 2023년 핫칩스(Hot Chips) 컨퍼런스에서 첫 공개된 이후 글로벌 반도체·AI 업계의 큰 관심을 받아왔다. 특히 수 분 내로 추론용 인프라를 배포할 수 있고, 수요에 따라 유연하게 확장 가능하며, 기존 애저 데이터 및 소프트웨어 스택과의 통합도 원활해 클라우드 기반 AI 모델 운영의 접근성과 효율성을 크게 높인 것이 특징이다. 이번 입점을 통해 퓨리오사AI는 애저 사용자에게 RNGD 기반 인프라 접근을 개방하고, 추후 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공할 계획이다. 기업 고객들은 이를 통해