와탭랩스가 AI 시대의 핵심 비전 ‘AI 네이티브 옵저버빌리티(AI-native observability)’의 일환으로 ‘와탭 GPU 모니터링’ 솔루션을 출시했다고 18일 밝혔다. AI 네이티브 옵저버빌리티는 데이터 수집부터 해석, 자동화, 사용자 경험 전반에 이르기까지 모든 과정을 AI 전제로 설계하고, 이를 기반으로 개발과 업데이트를 수행하는 AI 중심의 관측 구조를 의미한다. 이는 단순히 AI 기능을 보완한 수준의 모니터링과는 기술 철학과 설계 수준부터 근본적인 차이를 가진다. AI 네이티브 옵저버빌리티의 첫 단계로, 와탭랩스는 AI 인프라의 핵심 자산인 GPU 자원을 가시화하고 실시간으로 모니터링할 수 있는 GPU 모니터링 서비스를 공개했다. 이동인 와탭랩스 대표는 “GPU는 단순한 컴퓨팅 리소스를 넘어 이제는 기업 경쟁력의 기반이 되는 전략적 자산이다. 하지만 많은 기업들이 여전히 GPU 상태를 제대로 관측하지 못해 큰 손실을 겪고 있다”고 지적했다. 이어 “와탭랩스는 실제 고객사들과 협업하며 현장에서 발생하는 GPU 운영 문제를 잘 파악하고 있으며, 고객의 니즈에 맞춰 전체 인프라 안에서 GPU까지 통합 관측이 가능한 환경을 구축했다”고 강조했다.
오라클은 전 세계 AI 혁신 기업들이 AI 모델의 훈련 및 AI 추론과 애플리케이션 배포를 위해 오라클 클라우드 인프라스트럭처 AI 인프라스트럭처(OCI AI Infrastructure)와 OCI 슈퍼클러스터를 활용하고 있다고 밝혔다. 파이어웍스AI(Fireworks AI), 헤드라(Hedra), 누멘타(Numenta), 소니옥스(Soniox)를 비롯해 수백 개의 선도적인 AI 혁신 기업들이 AI 워크로드 실행 위치에 대한 제어, 컴퓨트 인스턴스 선택권, 확장성, 고성능, 비용 효율성 등의 이유로 OCI를 선택하고 있다. 산업 전반에서 AI 도입이 빠르게 확산됨에 따라 AI 기업들은 신속하고 경제적인 GPU 인스턴스 확장을 지원하는 안전하고 검증된 고가용성 클라우드 및 AI 인프라를 필요로 한다. AI 기업들은 OCI AI 인프라스트럭처를 통해 AI 훈련 및 추론, 디지털 트윈, 대규모 병렬 HPC 애플리케이션 등에 필요한 고성능 GPU 클러스터와 확장성 높은 컴퓨팅 파워에 접근할 수 있다. 크리스 간돌포 오라클 OCI 및 AI 부문 수석 부사장은 “OCI는 다양한 규모의 훈련 및 추론 요구사항을 충족시켜 주며, AI 혁신 기업들이 선호하는 클라우드 플랫폼으
AI 수요가 빠르게 증가하는 가운데, 기업들이 도입을 주저하는 가장 큰 이유는 GPU 등 인프라 구축 비용으로 나타났다. 오케스트로는 지난 6월 클라우드 서비스를 사용하는 기업 및 공공기관 종사자 6615명을 대상으로 한 ‘클라우드 환경에서의 AI 활용방안’ 설문 결과를 17일 발표했다. AI 도입 시 가장 큰 제약 요인은 GPU 등 기술 도입 비용(23.5%)이었다. 이어 전문 인력 부족(22.6%), 데이터 보안 우려(14.4%)가 뒤를 이었다. AI 도입은 초기 구축비도 크지만 사용량 기반의 과금 구조로 인해 장기적인 총소유비용(TCO) 부담이 크다. 여기에 AI 학습과 운영에 활용되는 핵심 데이터가 외부 클라우드에 저장되면서 보안 우려도 높아지고 있다. 비용과 보안이라는 이중 부담 속에서 퍼블릭 클라우드 기반 AI 환경의 한계가 분명해지면서 내부 데이터를 활용한 프라이빗 AI 환경은 더이상 선택이 아닌 대세로 자리잡고 있다. AI에 대한 기대 역시 현실적인 해법에 집중됐다. ‘비용 최적화’와 ‘실시간 보안 대응’이 각각 20.7%로 가장 높았고, ‘장애 원인 분석’(17.1%)과 ‘성능 병목 해소’(15.9%)가 뒤를 이었다. 이러한 기대는 기업이 실
DDR5, PCIe 5.0, Zen 4/5 기반 차세대 9000WX 시리즈 등 업그레이드 진행 예고 AMD는 올해 자사의 라이젠 스레드리퍼 프로 시리즈가 출시 5주년을 맞았다고 발표했다. 이 5년은 워크로드가 폭발적으로 증가한 시기와 맞물려 있다. 2017년 처음 선보인 라이젠 스레드리퍼 프로는 코어 수와 멀티스레드 역량을 앞세워 전문가용 워크스테이션 시장에 본격 진출했다. 이후 Zen 3 아키텍처 기반의 5000WX 시리즈와 7000WX 시리즈가 차례로 등장하면서, 최대 96코어에 달하는 사양과 단일 스레드 5GHz 이상 클럭을 동시 제공하며, 혁신적인 설계 철학을 입증했다. 단지 코어 수만이 아니다. AMD 측에 따르면, 라이젠 스레드리퍼 프로를 동일한 GPU 작업 환경에 적용했을 때, 경쟁 프로세서 대비 그래픽 성능이 최대 38% 더 빠르다. 특히 GPU 연산과 AI 연산 처리 성능에서도 각각 29%의 향상을 기록했다. 이러한 성능 우위는 멀티·싱글 스레드 작업을 가리지 않고 안정적인 생산성을 보장한다. AMD는 AutoCAD, 3ds Max, Inventor, Maya 등 주요 워크스테이션 툴과 긴밀히 협업해 라이젠 스레드리퍼 프로 특성을 최대한 활용
한국레노버가 전문가를 위한 최신 씽크스테이션 및 워크스테이션 솔루션을 출시하고 산업별 전문 작업 환경에 최적화된 고성능 워크플로우를 지원한다. 이번에 선보인 제품 및 솔루션은 ▲AI 개발 지원 ▲가상 환경 기반의 공간 컴퓨팅 성능 강화 ▲언제 어디서나 고성능 워크스테이션 접근이 가능한 유연한 업무 환경 구현 등 세 가지 핵심 영역에서 워크플로우를 가속화할 수 있도록 설계됐다. 새로운 씽크스테이션 P2 및 P3 시리즈는 AI, 레이 트레이싱, 뉴럴 렌더링 등 첨단 기술을 바탕으로 디자인, 엔지니어링 같은 고성능 작업 환경에 최적화된 데스크탑 워크스테이션이다. 전문가를 위한 엔비디아 RTX 에이다 제너레이션(Ada Generation) GPU를 지원하며, 추후 엔비디아 RTX 프로 블랙웰 워크스테이션 에디션 GPU도 지원할 예정이다. 씽크스테이션 P3 타워 2세대는 인텔 코어 울트라 9 프로세서와 엔비디아 RTX 프로 6000 블랙웰 맥스Q GPU(2025년 8월 말 국내 출시 예정)를 지원해 최대 3500TOPS(초당 3500조회 연산) 성능을 제공한다. DDR5 메모리 용량이 확대됐으며 스토리지 구성과 RAID 설정의 유연성이 향상돼 복잡한 전문 워크플로우도
트럼프 정부 관세 정책의 불확실성 속에서도 지난달 우리나라 정보통신기술(ICT) 분야 수출이 증가세를 유지하며 5월 중 최대 실적을 기록했다. 12일 과학기술정보통신부의 ICT 수출입 통계에 따르면 지난 5월 ICT 수출액은 208억8천만 달러로 지난해 같은 달보다 9.6% 증가했다. 최대 수출 품목인 반도체 수출액은 138억 달러로 디램과 낸드플래시 등 주요 제품의 고정가격이 반등하고 고대역폭 메모리(HBM) 등 고부가 메모리의 수출 호조가 이어지면서 역대 5월 중 최대 실적을 냈다. 휴대전화는 부품 수출이 10.2% 감소했지만 미국의 관세 부과 예고에 따라 스마트폰 완제품 수출액이 30.7% 증가하며 전체 수출액이 전년 동월 대비 2.8% 늘어난 10억5천만 달러를 기록했다. 휴대전화 수출액은 4개월 연속 늘었다. 통신장비 수출액은 2억 달러로 10.2% 증가했다. 전장용 장비 수요가 늘며 미국 수출액이 67.2% 증가했고 5G 장비 수요가 높은 인도 수출액도 147.0% 늘었다.컴퓨터·주변기기를 보면 저장장치(SSD) 수요가 회복세를 보이며 수출액 12억 달러로 1.7% 증가했다. 반면, 디스플레이는 미국 관세 정책 불확실성 등으로 인한 수요 둔화로 수
2025년 현재, 인공지능(AI) 반도체 시장에서 주목받는 키워드 중 하나는 ‘HBM(High Bandwidth Memory)’이다. 다시 말해 고대역폭 메모리인 HBM은 AI 서버와 고성능 연산용 GPU의 확산과 함께 폭발적으로 증가하는 데이터 처리 수요를 충족시키며, 기존 DRAM 중심의 메모리 시장을 재편하고 있다. 우리나라는 SK하이닉스와 삼성전자라는 막강한 투톱을 우리나라는 HBM을 기점으로 반도체 강국으로 나아가기 위한 미래를 구상하는 중이다. HBM, 단순 메모리가 아닌 ‘전략 자산’ HBM은 기존 DRAM보다 최대 10배 높은 대역폭을 제공하면서도, 물리적 공간은 줄이고 소비 전력은 낮추는 고성능 메모리 솔루션이다. 특히 AI 학습용 GPU나 고성능 컴퓨팅(HPC) 환경에서는 데이터 병목을 해결하는 핵심 역할을 한다. 한 예로, 엔비디아의 H100, H200, AMD의 MI300 시리즈, 최근 발표된 블랙웰 GPU 등 최신 AI 연산 칩은 모두 HBM과의 결합을 통해 성능을 극대화하고 있다. 이러한 흐름 속에서 SK하이닉스와 삼성전자는 HBM 시장에서 기술력과 수율, 공급 안정성 측면에서 글로벌 리더로 부상하고 있다. HBM3의 경우, 대역폭이
인공지능 분야에서 지식 체계나 데이터베이스를 그래프로 저장하고 활용하는 사례가 급증하지만, 일반적으로 복잡도가 높은 그래프 연산은 GPU 메모리의 제한으로 인해 매우 작은 규모의 그래프 등 비교적 단순한 연산만 처리할 수 있다는 한계가 있다. KAIST 연구진이 25대의 컴퓨터로 2000초가 걸리던 연산을 한 대의 GPU 컴퓨터로 처리할 수 있는 세계 최고 성능의 연산 프레임워크를 개발하는데 성공했다. KAIST는 전산학부 김민수 교수 연구팀이 한정된 크기의 메모리를 지닌 GPU를 이용해 1조 간선 규모의 초대규모 그래프에 대해 다양한 연산을 고속으로 처리할 수 있는 스케줄러 및 메모리 관리 기술들을 갖춘 일반 연산 프레임워크(일명 GFlux, 지플럭스)를 개발했다고 27일 밝혔다. 연구팀이 개발한 지플럭스 프레임워크는 그래프 연산을 GPU에 최적화된 단위 작업인 ‘지테스크(GTask)’로 나누고, 이를 효율적으로 GPU에 배분 및 처리하는 특수한 스케줄링 기법을 핵심 기술로 한다. 그래프를 GPU 처리에 최적화된 자체 개발 압축 포맷인 HGF로 변환해 SSD와 같은 저장장치에 저장 및 관리한다. 기존 표준 포맷인 CSR로 저장할 경우 1조 간선 규모의 그래
AI PC, 데이터 센터, 가우디 3 중심으로 한 AI 시스템 등 전략 공개해 인텔이 '컴퓨텍스 2025'에서 새로운 기술 패러다임에 대응하기 위한 전략을 대대적으로 공개했다. 사우라브 쿨카니(Saurabh Kulkarni) 인텔 데이터센터 AI 전략 및 제품 담당은 컴퓨텍스 2일차에 진행된 기술 포럼에 연사로 참여해 에이전틱 AI(Agentic AI)를 중심으로 변화하는 데이터 센터의 역할과 요구에 맞춘 맞춤형 인프라 구축 방향, 클라이언트와 엣지에서의 효율적 AI 활용 방안까지 폭넓은 기술 청사진을 제시했다. 이번 발표는 단순한 반도체 기술을 넘어 소프트웨어-하드웨어 통합 생태계 구축에 초점을 맞추며, 인텔이 차세대 AI 환경을 선도하려는 의지를 드러냈다. 자사의 ‘제온(Zeon) 6 프로세서’와 ‘가우디(Gaudi) 3’ 라인업, 클라이언트용 ARC 시리즈 등은 각 분야에서의 실질적 수요와 적용 가능성을 모두 반영했다. 인텔 역시 AI의 가치가 추론에 있음을 강조하며, 전 영역에 걸친 인프라 확장을 바탕으로 고객에게 새로운 비즈니스 가능성을 약속했다. 이러한 관점에서 사우라브 쿨카니는 ‘프런티어 AI 데이터 센터(Frontier AI Data Cente
중국 시장을 포기하지 않겠다는 엔비디아의 의지 반영된 것으로 보여 미국 정부의 대중국 수출 규제가 강화되는 가운데, 엔비디아가 중국 시장을 겨냥해 H20 칩의 저사양 버전을 준비 중인 것으로 확인됐다. 이는 미국 상무부가 최근 H20 칩마저 수출 허가 대상으로 포함하면서 사실상 기존 제품의 수출이 불가능해진 데 따른 대응이다. 로이터통신은 9일(현지시간) 복수의 소식통을 인용해 엔비디아가 향후 두 달 내로 H20의 축소형 모델을 출시할 계획이라고 보도했다. 새롭게 설계될 이 칩은 메모리 용량을 크게 줄이는 등 사양이 대폭 낮아질 것으로 알려졌다. 이로써 미국 수출 규제를 회피할 수 있는 수준으로 제품 성능을 조정하려는 전략으로 해석된다. H20 칩은 원래 중국 수출이 가능한 고성능 AI 칩 중 가장 높은 사양을 자랑했지만, 최근 미국 정부의 규제 강화로 인해 수출 제한 목록에 포함됐다. 엔비디아는 이에 대응해 새로운 기술 기준을 수립하고, 해당 기준에 맞춰 저사양 모델을 설계 중인 것으로 전해졌다. 특히 새로운 칩은 고객사 맞춤형 모듈 구성을 통해 성능 조정이 가능하다는 점에서 주목된다. 실제로 한 소식통은 “최종 사용자는 구성 변경을 통해 성능을 조절할 수
슈나이더 일렉트릭이 AI 기반 데이터센터 수요 증가에 대응해 고도화된 전력 관리 및 냉각 솔루션으로 스마트 에너지 관리를 실현하고 있다고 8일 밝혔다. 고성능 GPU 서버 기반의 AI 데이터센터는 일반적인 IT 인프라에 비해 훨씬 큰 전력 소모와 발열을 발생시킨다. 이에 따라 안정적인 전력 공급과 효율적인 에너지 관리가 비즈니스 연속성을 좌우하는 핵심 요소로 부상하고 있다. 슈나이더 일렉트릭은 고성능 UPS(무정전 전원 공급장치), DC(직류) 배전 시스템, 그리고 고밀도 서버 환경에 최적화된 액체 냉각 솔루션 등 데이터센터 전력 인프라 전반에 걸친 포트폴리오를 통해 이러한 니즈에 대응하고 있다. 특히 슈나이더 일렉트릭의 ‘갤럭시 V 시리즈(Galaxy V-Series) UPS’는 AI 워크로드에 특화된 고효율 전력 백업을 제공하는 UPS다. 고효율 운영 모드를 통해 최대 99%의 효율성을 제공하며 UPS의 전력 소비를 3배 이상 감소시키는 이컨버전(eConversion) 모드를 적용했다. 이 중 ‘갤럭시 VXL’은 500~1250kW(400V) 용량을 지원하는 3상 무정전전원장치(UPS)로 고밀도 기술은 물론 안정적이고 내결함성 있는 설계를 모두 갖춰 대규
정부가 1조8000억 원 규모의 추가경정예산을 편성하며 인공지능(AI) 인프라 확충에 시동을 걸었다. 그 중심에는 ‘GPU 1만 장’이라는 상징적 숫자가 있다. 엔비디아 H200, 블랙웰과 같은 최첨단 그래픽처리장치(GPU)를 국가 AI 컴퓨팅 센터에 도입해 국내 AI 생태계에 연산력을 공급한다는 목표다. 동시에 최대 5곳의 기업을 ‘국가대표 AI 모델(WBL)’ 개발사로 선정해 GPU, 데이터, 인재 등을 집중적으로 지원한다. 과연 GPU 물량 확보만으로 한국이 AI 강국이 될 수 있을까. 하드웨어 중심의 AI 전략의 명암 전 세계는 ‘AI 스펙 경쟁’에 돌입한 듯 보인다. 파라미터 수, 트레이닝 FLOPS, 연산 처리 속도 같은 수치가 기술력의 상징처럼 여겨진다. 하지만 반대로, 한국이 가진 연산능력이 늘어난다고 해서, 그것이 곧 고유한 AI 기술력과 경쟁력을 보장해줄 수 있을지에 대해서는 의문이다. 현재 AI 전략의 방향성이 스펙에만 집중돼 있는 것은 아닌지, 우리가 확보해야 할 보이지 않는 자산은 무엇인지 자문해볼 필요가 있다. 올해 11월부터 본격 가동되는 ‘국가 AI 컴퓨팅 센터’에는 추경을 통해 확보한 GPU 1만 장이 투입된다. 엔비디아의 최신
다올티에스와 업스테이지가 국내 AI 생태계 확장을 위한 전략적 협력에 나선다. 양사는 지난 14일 다올티에스 본사에서 양해각서(MOU)를 체결하고 AI 비즈니스 활용(LLM, RAG) 및 GPU 인프라 분야에서의 기술 협력과 시장 확대를 본격화한다고 밝혔다. 다올티에스는 델 테크놀로지스, 수세, 팔로알토 네트웍스의 국내 총판사로서, 서버·스토리지·네트워크 등 하드웨어 인프라뿐만 아니라 클라우드, 가상화, 인공지능 분야에 이르기까지 폭넓은 IT 솔루션을 제공하는 기업이다. 특히 지난해 전략사업본부를 신설하며 AI 사업을 본격화하고 다양한 ISV 파트너들과 협력해 AI 에코시스템을 구축 중이다. 업스테이지는 비정형 데이터 정형화 솔루션 ‘다큐먼트 파스(Document Parse)’, 자체 사전학습 거대언어모델(LLM) ‘솔라(Solar)’를 중심으로 금융, 법률, 헬스케어 등 다양한 분야에 산업별 맞춤형 AI 모델을 제공하고 있다. 이번 협약을 통해 양사는 다올티에스의 AI 인프라 설계 및 구축 역량과 업스테이지의 LLM 및 AI 솔루션 수행 역량을 결합, AI 인프라부터 애플리케이션 서비스까지 아우르는 통합 AI 플랫폼 사업의 활성화를 도모할 계획이다. 양사는
코오롱베니트가 자체 AI 솔루션센터에서 일주일 간 진행된 비즈니스 파트너 대상 세미나를 지난 11일 마쳤다. 이번 세미나는 코오롱베니트가 한국 델 테크놀로지스와 협력해 AI 인프라 트렌드부터 시장 공략까지 다양한 사업 전략을 파트너사에게 교육하는 취지로 진행됐다. 서울시 가산동에 위치한 자체 AI 솔루션센터에서 진행된 이번 세미나에서 코오롱베니트는 AI 서버·스토리지·HCI 인프라 관련 교육과 함께 공공 조달 사업 동향을 소개했다. 특히 코오롱베니트는 AI 인프라 사업 역량 강화를 위해 델이 새롭게 출시한 최신 AI 제품군과 호환 가능한 GPU, 서버, 솔루션의 필요성을 강조했다. 코오롱베니트는 동반 성장을 목표로 파트너사사업 역량 향상을 위한 교육 세미나를 정기적으로 개최할 계획이다. 코오롱베니트 AI 솔루션센터는 기업용 AI 솔루션, 특히 생성형 AI 기반의 다양한 솔루션을 시험해 볼 수 있는 통합 테스트 센터다. 코오롱베니트가 주도하는 AI 비즈니스 협력 체계 ‘AI 얼라이언스’ 참여사를 대상으로 생성형 AI(LLM), 머신러닝 및 딥러닝 분석, 기계학습운영(MLOps), AI 거버넌스, 데이터레이크, 벡터DB 등 기술과 솔루션을 시험해보는 기회를 제공
엔비디아, 창사 이래 처음으로 삼성전자·인텔 앞지르며 1위 기록 2024년 전 세계 반도체 시장이 전례 없는 변화를 맞이했다. 가트너는 최근 발표한 최종 조사에서 2024년 반도체 전체 매출이 총 6559억 달러로 집계됐다고 밝혔다. 이는 2023년 5421억 달러에서 21% 증가한 수치로, 지난 2월 예비 조사 당시 전망치보다 약 300억 달러, 3% 늘어난 것이다. AI 인프라 수요와 메모리 반등이 이 같은 성장세를 견인한 것으로 풀이된다. 무엇보다 이번 조사에서 눈길을 끈 대목은 공급업체 매출 순위의 대격변이다. 엔비디아는 창사 이래 처음으로 삼성전자와 인텔을 앞지르며 1위에 올랐다. 가트너의 가우라브 굽타 애널리스트는 “AI 인프라 구축 수요가 폭발적으로 증가하면서 데이터센터에서 활용되는 디스크리트 GPU(dGPU) 수요가 급증했고, 이는 곧 엔비디아 매출을 끌어올렸다”고 분석했다. 인공지능 붐이 단순한 트렌드를 넘어 반도체 시장의 구조적 판도까지 뒤바꾸고 있는 셈이다. 삼성전자는 급격한 가격 회복세를 보인 DRAM과 낸드플래시 분야에서 실적을 끌어올리며 2위 자리를 유지했다. 공급 부족 해소 이후 수요 회복과 함께 가격이 반등한 것이 주효했던 것으로