국내 팹리스가 핫 칩스 행사서 신제품 발표자로 선정된 첫 사례로 알려져
퓨리오사AI가 지난 26일(현지시간) 미국에서 열린 '핫 칩스(Hot Chips) 2024' 컨퍼런스에서 2세대 AI 반도체 '레니게이드'를 처음으로 공개했다.
퓨리오사AI의 2세대 AI 반도체인 레니게이드는 거대언어모델(LLM) 및 멀티모달 모델의 효율적인 추론을 위해 설계된 데이터 센터용 가속기다. 특히 이번 발표는 국내 팹리스가 핫 칩스 행사에서 신제품 발표자로 선정된 첫 사례로 알려져 화제가 됐다. HBM3가 탑재된 혁신적 추론용 AI 반도체에 대한 행사 현장의 관심과 반응도 높아, 레니게이드가 시장에 새로운 바람을 일으킬 것으로 기대된다.
퓨리오사AI는 2017년 삼성전자, AMD, 퀄컴 출신의 세 명의 공동 창업자에 의해 설립된 이후, 지속적인 기술 혁신과 제품 양산에 집중해 왔다. 그 결과 TSMC로부터 첫 레니게이드 샘플을 올 5월에 받은 후 빠른 속도로 브링업을 완료함으로써 퓨리오사AI는 1세대 제품 개발부터 양산까지 과정에서 입증했던 역량을 강화했다. 이뿐 아니라 2021년 당시 출시된 1세대 칩 첫 샘플을 받은 지 3주 만에 브링업을 완료하고 MLPerf 벤치마크 결과를 제출한 바 있으며, 이후 컴파일러 개선을 통해 성능을 113% 향상시킨 사례도 있었다.
초기 테스트 결과, 레니게이드는 GPT-J 및 라마 3.1과 같은 주요 벤치마크 및 LLM에서 경쟁력 있는 성능을 보였으며, 단일 PCIe 카드 기준으로 약 100억 개의 파라미터를 가진 모델에서 초당 약 3000여 개의 토큰을 처리할 수 있는 성능을 보여줬다.
퓨리오사AI 백준호 대표는 "이번 행사에서 레니게이드를 글로벌 시장에 공개하고 빠른 초기 브링업 결과를 발표할 수 있었던 것은 자사 기술 개발이 하나의 결실을 맺은 것"이라며, "레니게이드는 업계의 실질적인 추론 니즈를 충족시키는 지속 가능하고 현실적인 AI 컴퓨팅 솔루션"이라고 강조했다.
이어 그는 "우리 제품이 LLM을 효율적으로 연산한다는 것에 대한 증명은 회사가 다음 성장 단계에 대한 진입을 의미한다"고 전했다. 이날 백준호 대표는 '퓨리오사 RNGD : 지속 가능한 AI 컴퓨팅을 위한 텐서 축약 프로세서'라는 주제로 제품 소개 및 초기 벤치마크를 공개하며, 라마 3.1 70B의 라이브 데모를 선보였다.
슈퍼마이크로 기술 및 AI 담당 수석 부사장이자 EMEA 지역 사장 겸 매니징 디렉터인 Vik Malyala는 "퓨리오사 레니게이드 AI 추론 솔루션은 슈퍼마이크로와 함께 친환경 컴퓨팅의 도입을 촉진할 것이며, 퓨리오사의 기술과 제품을 통해 슈퍼마이크로 시스템은 전력 소비를 줄이면서도 뛰어난 추론 성능을 제공할 것으로 본다"고 평가했다.
GUC의 CMO인 Aditya Raina는 "퓨리오사AI와의 협력으로 성능과 전력 효율성 모두 뛰어난 레니게이드를 시장에 선보이게 됐다. AI 반도체 개발에는 알고리즘, 소프트웨어, 하드웨어에 대한 깊은 이해가 필수적인데, 퓨리오사AI는 설계에서부터 양산 샘플 출시까지 탁월한 역량을 보여주며, 업계에서 가장 효율적인 AI 추론 칩을 출시하게 됐다"고 전했다.
헬로티 서재창 기자 |