케이투스(KAYTUS)가 최신 V3 서버 제품군을 출시했다고 6일 밝혔다.
V3 서버 제품군은 6세대 인텔 제온 프로세서와 AMD EPYC 9005 시리즈 프로세서를 지원하며 일반 컴퓨팅, 멀티 노드, 크리티컬 컴퓨팅, 스토리지 최적화 및 랙 스케일 시스템을 아우르는 17가지 서버 모델로 구성된다. V3 서버는 다양한 컴퓨팅 플랫폼과 광범위한 호환성을 제공하는 것은 물론 향상된 인텔리전스 및 혁신적인 냉각 솔루션을 제공하며 다양한 AI 애플리케이션을 지원한다.
또한 고도화된 컴퓨팅 및 스토리지 혁신으로 CPU 버스 대역폭과 메모리 대역폭 및 용량을 최적화해 듀얼 소켓 서버에서 최대 576개의 코어와 최대 5.0 GHz의 클럭 속도를 구현하고 메모리 대역폭을 136% 향상시킨다. 테스트 데이터에 따르면, LLaMA2 대규모 모델 AI 추론 시나리오에서 V3 서버의 전체 성능은 이전 세대 제품에 비해 최대 3배까지 향상된 것으로 나타났다.
점차 다양해지는 AI 애플리케이션 시나리오는 새로운 컴퓨팅 과제를 끊임없이 제기하고 있다. 각각의 AI 애플리케이션이 고유한 특성과 시스템 요구사항을 지니고 있는 만큼, 단순 알고리즘 외에 다양한 컴퓨팅 생태계와 최적화된 데이터 처리 지원도 필수적이다.
새로 출시된 V3 서버 제품군은 이런 필요에 맞춰 CPU, GPU, FPGA 등 다양한 플랫폼을 지원하며 콤포넌트부터 펌웨어, 노드, 랙스케일 전반에 걸쳐 풀스택(full-stack, 전방위적인) 개방성을 제공한다. 또 V3 서버는 통합된 컴퓨팅 기반으로 컴퓨팅 효율성을 높이며 노드 수직확장(scale-up)과 네트워크 수평 확장(scale-out)을 모두 지원해 AI 모델의 확장 법칙 요구 사항을 충족하고 폭넑은 AI 시나리오를 지원한다.
콤포넌트 측면에서 V3 서버는 CXL 어댑터 카드와 BOX를 통한 메모리 확장을 지원하고, CXL 사양을 충족하여 컴퓨팅 성능과 데이터 전송 용량 간 균형을 최적화한다.
V3 펌웨어는 OpenBMC 기반의 개방형 펌웨어 관리 플랫폼을 도입해 여러 레이어로 나뉜 분리형 아키텍처를 바탕으로 한 모듈화된 설계를 채택한다. 이를 통해 비동기식 반복 작업과 기능별로 분리된 업그레이드가 가능하며, 여러 컴퓨팅 플랫폼에서 통합 관리를 가능하게 한다.
노드 수준에서는 서버 컴퓨팅 모듈 설계 사양 OCM을 기반으로 한 모듈형 분리 아키텍처를 통해 ‘컴퓨팅 유닛 분리’(Computing unit decoupling)를 실현했다. CPU와 메모리를 중심으로 표준 고속/저속 상호연결 인터페이스를 지원하는 최소 컴퓨팅 유닛이 구성된다. 이는 프로세서 컴퓨팅을 개별 콤포넌트처럼 다루도록 설계하여 인텔 및 AMD 프로세서와 폭넓은 호환성을 제공하고, 통합된 컴퓨팅 아키텍처와 ‘한 대의 장비, 다중 코어(One machine, multiple cores’” 구성을 구현해 도입 장벽을 낮춘다.
이로 인해 사용자는 다양한 애플리케이션 시나리오에서 최적의 솔루션을 신속하게 찾을 수 있다. 예를 들어, KR2190V3 서버는 완전히 분리된 구조로 인텔 BHS 및 AMD 투린(Turin) 프로세서를 지원하며 크로스 플랫폼 및 다중 시나리오에서 빠른 구축이 가능하다.
V3 서버 제품군은 UBB2.0 사양 기반의 다각화된 오픈 가속 컴퓨팅 플랫폼을 갖추고 있으며 OCP 오픈 가속 사양에 부합하는 다양한 OAM v2.0 모듈과 호환된다. 완전한 모듈식 설계와 뛰어난 시스템 에너지 효율성으로 대형 모델 및 AI 애플리케이션의 반복 개발을 지원하며, 컴퓨팅 성능의 혁신과 통합을 더욱 가속화한다.
랙스케일 단계에서 케이투스는 미래형 아키텍처에 맞춰 설계된 일부 OCP 오픈 표준과 호환되는 랙스케일 서버를 제공한다. 이 서버는 19/21인치 노드를 수용해 다양한 컴퓨팅 유연성 및 개방형 디커플링을 가능하게 하며 딜리버리와 동시에 신속한 비즈니스 구축을 지원한다.
데이터는 모델의 기반이 되기 때문에 데이터 처리 가속화는 필수 요건이다. 대규모 언어 모델(LLM), 특히 멀티모달 모델은 대폭 증가한 방대한 데이터셋을 원활하게 처리하기 위해 데이터 전처리와 저장을 지원할 더 큰 메모리 용량의 시스템을 필요로 한다.
V3 서버는 이러한 요구에 맞춰 데이터 스토리지에 최적화됐으며 단일 드라이브에서 최대 128TB의 용량과 최대 6PB의 단일 서버 용량, 단일 랙에서 2.7배 증가된 스토리지를 제공한다. 이런 기술력은 대규모 데이터 처리 및 스토리지 성능을 극대화해 대규모 AI 애플리케이션의 다양한 요구 사항을 효과적으로 충족시킨다.
헬로티 이창현 기자 |