산업용 컴퓨팅 분야 글로벌 선도 기업 어드밴텍이 NVIDIA 기반 엣지 AI 플랫폼을 통해 오픈 소스 대규모 언어 모델(LLM) 생태계 확장에 박차를 가하고 있다. 특히 Meta의 Llama와 중국의 딥시크(DeepSeek) 등 최신 오픈 LLM을 엣지 환경에서도 원활히 지원할 수 있어 산업 전반의 AI 적용 가능성을 넓히고 있다는 평가다. 어드밴텍은 NVIDIA의 TensorRT-LLM, Jetson 플랫폼 등 풀 스택 가속 기술을 활용해 경량 추론부터 풀 스케일 AI 모델 훈련까지 모두 아우를 수 있는 엣지 AI 시스템을 제공한다. 이는 챗봇, AI 도우미, 산업용 모니터링, 엔터프라이즈 지식 관리 등 다양한 애플리케이션에 활용되며 특히 고속 처리와 확장성, 전력 효율성을 동시에 갖춘 점이 강점이다. 대표적인 제품으로는 ▲경량 추론에 적합한 ‘MIC-711-OX’ ▲최적화된 LLM 추론이 가능한 ‘MIC-770V3 + MIC-75M20’ ▲도메인 특화 AI 훈련용 ‘SKY-602E3’ 등이 있다. 각각은 실시간 챗봇, 고객 응대, 법률 및 의료 AI 분석, 코드 생성 AI 등 다양한 산업 시나리오에 맞춰 설계되었으며 최대 1000 TOPS 이상의 연산 성
클라우드플레어가 서버리스 AI 추론 플랫폼인 ‘워커스 AI(Workers AI)’와 AI 애플리케이션 구축을 위한 여러 도구에 신규 기능을 도입했다고 30일 밝혔다. 이를 통해 개발자가 더욱 빠르고 향상된 성능의 AI 애플리케이션을 손쉽게 구축할 수 있도록 지원한다. 워커스 AI는 전 세계 어디에서나 사용자와 가까운 곳에서 AI 추론을 실행하고 글로벌 AI 애플리케이션을 구축할 수 있는 플랫폼이다. 이번 도입으로 워커스 AI에 구축된 애플리케이션은 추론 속도 향상, 대형 모델에 대한 지원, 성능 분석 등의 혜택을 누릴 수 있게 된다. 대형언어모델(LLM)의 규모가 점점 작아지고 성능은 향상됨에 따라 네트워크 속도가 고객의 채택과 원활한 AI 상호 작용에 장애물이 될 것으로 예상된다. 클라우드플레어의 글로벌 분산 네트워크는 네트워크 지연 시간을 최소화해 일반적으로 제한된 데이터센터에 집중돼 있는 자원으로 구성된 다른 네트워크와 차별화된다. 클라우드플레어의 서버리스 추론 플랫폼인 워커스 AI는 현재 전 세계 180여 개의 도시에 GPU를 배치해 전 세계 엔드유저에게 짧은 대기 시간을 제공하도록 설계됐다. 워커스 AI는 이러한 GPU 네트워크를 통해 모든 AI 플
장 핑안 화웨이 클라우드 대표가 광산업, 정부, 운송, 날씨, 의료, 가상 인간, 연구개발(R&D)을 위한 '화웨이 판구 모델(Pangu Model)'과 최신 '화웨이 클라우드 어센드 AI 클라우드 서비스'를 발표했다. 이는 다양한 산업 전반에 걸쳐 클라우드 기반 AI 사용을 촉진하기 위한 화웨이 클라우드의 노력이 담긴 제품 및 솔루션이다. 화웨이의 대표적인 연례 행사인 '화웨이 커넥트 2023(Huawei Connect 2023)'에서 장핑안 화웨이 상무이사 겸 화웨이 클라우드 대표는 '지능형 세상을 위한 클라우드 기반: AI를 통한 산업 재편'을 주제로 기조연설을 했다. 장 대표는 판구가 다양한 고객이 직면한 가장 시급한 요구 사항을 해결하는데 초점을 맞추고 있다고 설명했다. 앞서 화웨이 클라우드는 '2023 화웨이 개발자 콘퍼런스'에서 '5+N+X' 디커플링 아키텍처와 계층형 AI 역량으로 광범위한 모델 및 애플리케이션을 지원하는 '판구 모델 3.0(Pangu Model 3.0)'을 발표한 바 있다. 화웨이 클라우드는 화웨이 커넥트에서 광산업, 정부, 운송, 날씨, 의료, 가상 인간, R&D분야로 판구 모델을 확장한다고 발표했다. 일례로