레드햇은 AWS 상에서 레드햇 AI와 AWS AI 실리콘을 통해 엔터프라이즈급 생성형 AI를 지원하기 위해 AWS와의 협업을 확대한다고 3일 밝혔다. 이번 협업의 핵심은 기업이 기반 하드웨어와 관계없이 고성능·고효율 AI 추론을 대규모로 실행할 수 있도록 유연성을 제공하는 데 있다. 생성형 AI 확산과 이에 따른 대규모 AI 추론의 수요 증가는 기업이 기존 IT 인프라를 재정비하도록 만들고 있다. IDC는 “2027년까지 전 세계 조직의 약 40%가 성능 최적화, 비용 효율성, 특수 컴퓨팅 요구에 대응하기 위해 ARM 기반 및 AI/ML 전용 칩을 포함한 맞춤형 실리콘을 사용할 것”이라고 전망했다. 이는 고성능 AI 애플리케이션을 위한 최적화된 연산 구조의 필요성이 높아지고 있음을 의미한다. 레드햇과 AWS의 협업은 레드햇의 플랫폼 역량과 AWS의 클라우드 인프라, 그리고 AI 전용 칩셋인 ‘AWS 인퍼런시아2(AWS Inferentia2)’ 및 ‘AWS 트레이니움3(AWS Trainium3)’의 결합을 기반으로, 기업이 완전한(full-stack) 생성형 AI 전략을 구축하도록 지원하는 데 초점을 둔다. 이번 협업에서 발표된 주요 내용은 다음과 같다. 첫째
인공지능(AI) 추론 기능 위해 설계한 칩 '인퍼런시아2'도 출시 아마존웹서비스(AWS)가 29일(현지시간) 고성능 컴퓨터에 사용되는 새로운 칩을 공개했다. 아마존은 미국 라스베이거스에서 개최한 연례 기술 콘퍼런스 '리인벤트 2022' 행사에서 그래비톤 프로세서의 새로운 버전인 '그래비톤3E'를 발표했다. 피터 디샌티스 AWS 수석부사장은 고성능 컴퓨터 구동에 필요한 그래비톤3E의 계산 능력은 기존 칩의 2배라며 이 칩을 적용한 고성능 컴퓨팅 서비스는 이전과 비교해 20% 향상된 성능을 제공할 것이라고 밝혔다. 블룸버그 통신은 AWS가 기상 예측, 유전자 분석 등과 같은 고성능 컴퓨팅 분야에서 고객에게 새로운 서비스를 제공할 수 있게 됐다며 인텔, 엔비디아, AMD 등의 반도체 회사와 직접 경쟁하게 됐다고 평가했다. 이와 함께 아마존은 인공지능(AI) 추론 기능을 위해 설계한 칩 '인퍼런시아2'도 공개했다. 이 칩은 기존 버전보다 더 많은 데이터를 처리해 인간의 언어, 소프트웨어로 생성된 이미지 등을 감지하고 해석하는 기능을 제공한다. 아울러 아마존은 재고 문제 등을 관리해주는 'AWS 서플라이 체인', 고객 맞춤형 광고를 제공하는 'AWS 클린 룸' 등 소