
딥엑스가 삼성파운드리, 가온칩스와 2나노 공정 계약을 체결하고 차세대 생성형 AI 온디바이스 반도체 ‘DX-M2’ 개발에 착수했다. 이로써 딥엑스는 삼성파운드리의 2나노 공정을 사용하는 상용 고객이 됐다.
DX-M2는 초저전력 환경에서 대규모 생성형 AI 모델을 실시간으로 추론할 수 있도록 설계된 차세대 AI 반도체다. 시제품 제작을 위한 MPW(다중 프로젝트 웨이퍼)는 2026년 상반기 생산에 들어가며, 양산은 2027년을 목표로 하고 있다. 이번 프로젝트는 국내 팹리스 산업의 고부가가치 반도체 생태계 확대와 2나노 시스템 반도체 조기 상용화에 기여할 것으로 기대된다.
딥엑스는 기존 5나노 공정 기반 DX-M1 대비, GAA(Gate-All-Around) 구조의 2나노 공정에서 전성비(성능 대비 전력 효율)가 약 두 배 향상된다는 점에 주목했다. 생성형 AI는 막대한 연산량으로 인해 전력 소모와 발열이 큰데, 전성비는 온디바이스 AI 구현의 핵심 지표로 꼽힌다. 지난해 11월부터 삼성 2나노 공정의 전력 효율, 성능, 제조원가, 수율 등을 분석한 결과, DX-M2가 목표 성능을 충족할 수 있다고 판단했다.
딥엑스는 이미 5나노 공정으로 비전 AI 특화 제품 DX-M1을 개발해 로봇, 스마트 카메라, 공장 자동화 등 다양한 산업에 적용하고 있다. 이번 DX-M2는 생성형 AI와 멀티모달 AI까지 지원하는 2세대 제품으로, 온디바이스 환경에서 고성능 AI 서비스를 제공하는 것을 목표로 한다.
현재 생성형 AI는 데이터센터 기반 서비스가 주류지만, 높은 연산 비용과 API 과금 구조로 인해 대중 확산이 제한적이다. 딥엑스는 이러한 한계를 극복하기 위해, 대부분의 생성형 AI 트래픽을 ‘초저전력 무과금 AI’ 형태로 온디바이스에서 처리하는 전략을 세웠다. DX-M2는 데이터센터 대비 수십 배의 전력 효율성과 낮은 탄소 배출량을 구현해, 보다 지속가능하고 접근 가능한 AI 환경을 제시한다.
DX-M2는 5W 이하 전력 소모로 200억 개 파라미터(20B)급 생성형 AI 모델을 초당 20~30토큰의 속도로 실시간 추론할 수 있다. 이를 통해 발열과 전력 제약이 큰 로봇, 가전, 노트북에서도 전문가 수준의 AI 모델을 독립적으로 구동할 수 있다. 특히 ‘DeepSeek’, ‘LLaMA 4’ 등 20B급 모델을 MOE(Mixture of Experts) 구조로 운용해, 100B급 준-AGI 성능을 실현하는 것을 목표로 하고 있다.
올초 딥엑스는 DX-M2의 프로토타입 설계를 완료하고 시연 가능한 수준까지 개발을 마쳤다. 참고로, 퀄컴 등 글로벌 경쟁사가 10B급 sLM 모델을 초당 10토큰 수준, 10~20W 전력 소모로 구동하는 것과 비교하면, 딥엑스는 연산 성능·지능 수준·전력 효율에서 모두 우위를 확보하는 것을 목표로 한다. 이를 통해 생성형 AI의 온디바이스 전환을 선도하는 글로벌 리더로 자리매김하겠다는 전략이다.
김녹원 대표는 “DX-M2는 생성형 AI의 대중화와 산업화를 이끄는 핵심 플랫폼”이라며 “누구나 AI의 혜택을 누릴 수 있는 세상을 만들기 위해 기술 장벽을 낮추겠다”고 말했다.
헬로티 서재창 기자 |