헬로티 –매일 만나는 첨단 산업, 경제, IT 소식

주메뉴 바로가기
본문 바로가기

2026.03.10(화)

동두천 8.5℃맑음
강릉 8.1℃맑음
서울 8.9℃맑음
대전 9.7℃맑음
대구 11.5℃맑음
울산 9.6℃맑음
광주 10.8℃맑음
부산 9.9℃맑음
고창 6.6℃맑음
제주 9.7℃맑음
강화 5.7℃맑음
보은 8.9℃맑음
금산 9.1℃맑음
강진군 10.6℃맑음
경주시 10.1℃맑음
거제 8.7℃맑음

기상청 제공

#추론

홈
#추론

인터뷰 [봇규의 헬로BOT] “가상에서 키우고 현실서 단련한다”...모벤시스가 바꾸는 피지컬 AI의 ‘실행 공식’

피지컬 AI(Physical AI)를 둘러싼 글로벌 패권 경쟁이 모델의 거대화와 데이터 확보전을 넘어서는 양상이다. 이제는 ‘실행의 완결성’이라는 현실적인 문제를 해결하는 데 집중하는 모양새다. 이렇게 뜨거운 감자로 올라선 피지컬 AI는 가상 환경의 지능이 로봇·장비 등 물리적 실체에 이식된 형태를 말한다. 즉 인공지능(AI)이 상황을 인식하고 판단하는 ‘뇌’라면, 피지컬 AI는 그 판단을 근육과 관절의 움직임으로 바꿔 실질적인 행동을 수행하는 ‘신체’를 가진 AI다. 이 기술이 제조업의 판도를 바꿀 핵심으로 꼽히는 이유는 ‘자율화(Autonomous)’를 구현하기 때문이다. 기존 로봇이 정해진 궤적만 반복했다면, 피지컬 AI는 스스로 상황을 파악해 최적의 동작을 결정한다. 하지만 이 차세대 지능이 산업 현장에서 가치를 인정받기 위해서는 치명적인 전제 조건이 붙는다. 바로 ‘신뢰성’이다. 가상 및 시뮬레이션 환경에서 백발백중이던 AI 기반 로봇이 실제 공장 라인에 투입되는 순간, 미세한 진동과 엇박자를 내며 멈춰 서는 장면은 더 이상 낯선 풍경이 아니다. 현시점 모든 산업 현장이 원하는 AI의 가치는 모터와 축이 그 결정을 얼마나 ‘제때’, ‘일관된 품질로’
- 최재규 기자
- 2025-12-24 18:56
인터뷰 [헬로AI] AI 추론 최적화 한계 돌파하는 에너자이 “오라, 온디바이스 시대”

에너자이 정현우 CSO 인터뷰 빅테크 중심으로 AI 기술이 폭발적으로 진화하는 지금, 소프트웨어 최적화와 하드웨어 제약을 모두 고려한 AI 추론이 기술 경쟁의 핵심으로 떠오르고 있다. 에너자이는 AI 추론 성능을 극대화하는 자체 엔진 ‘옵티미엄(Optimium)’으로 AI 기술의 실용성과 확장 가능성을 동시에 확보하며 주목받고 있다. 학습보다 추론이 중심이 되는 시대, 에너자이의 기술은 주요 반도체 팹리스·IP 기업과의 협업을 기반으로 빠르게 확장 중이다. 손 안에 AI, 최적화와 양자화 주목하다 AI 기술은 온디바이스 환경에서 성능을 구현하는 추론 영역을 주목한다. AI 추론은 학습 모델을 기반으로 데이터를 처리해 결과를 도출하는 과정이며, 추론의 속도와 효율은 제품 사용성과 직결된다. 특히 엣지 환경이나 온디바이스 구조에서는 고사양 GPU 없이 AI 기능을 구동해야 하기에 경량화와 최적화 기술이 필수적이다. 에너자이는 바로 이 지점에 주목해 옵티미엄을 중심으로 하드웨어와 소프트웨어의 결합 최적화 전략을 내세웠다. 에너자이 정현우 CSO는 “AI 기술은 이제 연구실 밖으로 나왔다. 진짜 승부는 ‘현실 환경에서 얼마나 빠르고 가볍게 AI를 실행하는가’에 달렸
- 서재창 기자
- 2025-08-04 22:32
AI [AI Tech 2025 프리뷰] 망고부스트,LLMBoost와 DPU로 LLM 추론 최적화 나서다

망고부스트 김창수 실장, '차세대 LLM 추론 인프라 전략' 주제로 발표 진행 망고부스트가 오는 5월 15일 개최되는 ‘AI 융합 비즈니스 개발 컨퍼런스 2025(AI Tech 2025)’에 참가해 '차세대 LLM 추론 인프라 전략'을 주제로 발표한다. AI Tech 2025는 ‘Your Fine-Tuning Roadmap’을 주제로, 파인튜닝 이후 기업 현장에서 AI를 어떻게 실질적으로 활용할 것인지에 초점을 맞춘다. 생성형 AI의 확산 속에서 많은 기업이 겪는 운영상의 고민과 실무자의 현장 요구에 대응하도록 최신 기술 트렌드와 구체적인 적용 사례가 공유된다. 발표자로 참여하는 망고부스트 김창수 실장은 '차세대 LLM 추론 인프라 전략 : LLMBoost 자동화와 DPU 기반 가속의 시너지를 중심으로'라는 주제로 인사이트를 공유한다. 김창수 실장은 "이번 발표에서는 환경별 최적화가 필수인 현재 LLM 추론 인프라를 소개한다. 이와 함께 자동 튜닝으로 성능을 극대화하고 Multi Vendor를 지원하는 LLMBoost, 유연한 확장성과 관리성을 갖춘 차세대 Disaggregated Prefill·Decode 인프라을 비롯해 DPU 기반 스토리지 및 RAG 가
- 서재창 기자
- 2025-05-07 20:15
스포트라이트 GPU만 앞세운 AI 스펙 경쟁, 이면에 놓치고 있는 것들

정부가 1조8000억 원 규모의 추가경정예산을 편성하며 인공지능(AI) 인프라 확충에 시동을 걸었다. 그 중심에는 ‘GPU 1만 장’이라는 상징적 숫자가 있다. 엔비디아 H200, 블랙웰과 같은 최첨단 그래픽처리장치(GPU)를 국가 AI 컴퓨팅 센터에 도입해 국내 AI 생태계에 연산력을 공급한다는 목표다. 동시에 최대 5곳의 기업을 ‘국가대표 AI 모델(WBL)’ 개발사로 선정해 GPU, 데이터, 인재 등을 집중적으로 지원한다. 과연 GPU 물량 확보만으로 한국이 AI 강국이 될 수 있을까. 하드웨어 중심의 AI 전략의 명암 전 세계는 ‘AI 스펙 경쟁’에 돌입한 듯 보인다. 파라미터 수, 트레이닝 FLOPS, 연산 처리 속도 같은 수치가 기술력의 상징처럼 여겨진다. 하지만 반대로, 한국이 가진 연산능력이 늘어난다고 해서, 그것이 곧 고유한 AI 기술력과 경쟁력을 보장해줄 수 있을지에 대해서는 의문이다. 현재 AI 전략의 방향성이 스펙에만 집중돼 있는 것은 아닌지, 우리가 확보해야 할 보이지 않는 자산은 무엇인지 자문해볼 필요가 있다. 올해 11월부터 본격 가동되는 ‘국가 AI 컴퓨팅 센터’에는 추경을 통해 확보한 GPU 1만 장이 투입된다. 엔비디아의 최신
- 서재창 기자
- 2025-05-01 22:50
인터뷰 [헬로AI] 디노티시아 VDPU가 바꾼 ‘쓸모 있는’ AI 인프라 공식

디노티시아 노홍찬 CDO 인터뷰 챗GPT가 월간 사용자 수 1억 명을 넘어선 가운데, 생성형 AI는 정보 생성에서 추론과 서비스로 무게중심을 옮겼다. 특히 RAG 기술이 확산되면서, 이를 뒷받침할 AI 인프라 수요가 높아졌다. 오늘날 많은 기업이 오픈소스를 조합해 자체적인 RAG 시스템을 구축하지만, 처리 속도와 정확도, 유지보수 측면에서 기술적 한계를 절감하는 중이다. 이와 같은 한계를 정면으로 풀어가는 스타트업이 있다. 벡터DB와 전용 AI 가속기, 그리고 통합 소프트웨어 플랫폼을 동시에 개발하며, AI의 추론 성능과 효율성 모두를 겨냥한 ‘디노티시아’가 바로 그 주인공이다. 추론 성능의 토대가 된 VDPU의 탄생 생성형 AI는 최근 몇 년간 모델 성능과 파라미터 크기 중심의 경쟁을 이어 왔다. 하지만 GPT-4와 같은 고성능 모델이 등장한 이후, 시장은 점차 새로운 문제에 직면하고 있다. 모델은 충분히 커졌지만, 이를 실제 업무에 적용하기 위해서는 파라미터의 크기만으로 해결되지 않는 과제가 많아진 것이다. 특히 기업 내부 데이터, 실시간으로 생성되는 동적 데이터 등을 AI가 기억하고 활용하려면, 학습이 아닌 추론 환경의 최적화가 필요하다. 디노티시아는
- 서재창 기자
- 2025-04-03 10:51
AI 망고부스트, AI 추론 성능 높이는 'Mango LLMBoost' 발표

타 LLM 추론 엔진 대비 최대 12.6배 상대적 성능 향상과 92%의 비용 절감 망고부스트는 AI 추론 성능과 효율성을 획기적으로 향상시키는 시스템 최적화 소프트웨어 'Mango LLMBoost'를 공식 출시했다고 밝혔다. 망고부스트는 Mango LLMBoost가 효과적인 시스템 스케줄 조정, 커널 최적화, 독자적인 데이터 Prefetching 기술 및 최신 GPU를 최대한 활용한 모델 양자화 기술을 통해 타 LLM 추론 엔진 대비 최대 12.6배의 상대적 성능 향상과 92%의 비용 절감을 달성한다고 밝혔다. 망고부스트 관계자는 “Mango LLMBoost는 경쟁 솔루션 대비 압도적인 성능 향상과 비용 절감 효과를 증명하며, 정식 출시 전부터 이미 강력한 도입 의향을 보인 빅테크 해외 지사에서 도입을 앞두고 있다”고 밝혔다. Mango LLMBoost의 강점으로 GPU 호환성, 다중 모델 배포 및 관리 기능, 간편한 배포와 Open API 호환성을 꼽았다. Mango LLMBoost는 NVIDIA 및 AMD의 주요 GPU와 모두 호환되고, Llama, Mixtral, Gemma, Qwen2, Llava, Phi3, Chameleon, MiniCPM, GLM
- 서재창 기자
- 2025-01-17 13:20
최신뉴스 AMD, 새 AI 엔진 탑재한 버설 적응형 SoC 포트폴리오 발표

단일 디바이스로 AI 기반 임베디드 시스템의 엔드투엔드 가속 제공 AMD는 새로운 2세대 버설 AI 엣지 시리즈와 버설 프라임 시리즈 적응형 SoC를 출시해 확장된 AMD 버설 적응형 SoC 포트폴리오를 구축한다고 밝혔다. 2세대 버설 시리즈는 전처리에서 AI 추론 및 후처리에 이르기까지 단일 디바이스로 AI 기반 임베디드 시스템의 엔드투엔드 가속을 제공한다. 1세대를 기반으로 개발된 2세대 버설 시리즈 포트폴리오의 첫 제품군은 새로운 AI 엔진을 바탕으로 1세대 버설 AI 엣지 시리즈 디바이스보다 최대 3배 더 높은 와트당 TOPS를 제공한다. 또한, 새로운 고성능 통합 Arm CPU를 통해 1세대 버설 AI 엣지 및 프라임 시리즈 디바이스 대비 최대 10배에 달하는 스칼라 컴퓨팅을 제공한다. AMD 적응형 및 임베디드 컴퓨팅 그룹 총괄 책임자인 살릴 라제(Salil Raje) 수석 부사장은 “AI 지원 임베디드 애플리케이션에 대한 수요가 폭발적으로 증가하면서 전력 및 공간이 제한적인 임베디드 시스템에서 가장 효율적으로 엔드투엔드 가속을 지원하는 단일 칩 솔루션에 대한 요구가 높아지고 있다”고 말했다. 이어 그는 “40년 이상 축적된 적응형 컴퓨팅 리더십을
- 서재창 기자
- 2024-04-11 14:18
최신뉴스 자율주행 겨냥한 사피온, DNV로부터 ISO 26262 인증 획득

ISO26262 기준에 부합하는 관리 프로세스에 맞춰 오토모티브향 NPU IP 개발 사피온(SAPEON, 대표 류수정, www.sapeon.com)은 오늘, 자율주행 추론용 오토모티브향 NPU(신경망처리장치) IP가 제3자 국제 평가인증기관인 DNV(Det Norske Veritas)로부터 ISO 26262 인증을 획득했다고 밝혔다. 사피온은 자율주행 차량이 요구하는 추론 요건 및 안전 설계 요구 사항을 만족하기 위해 ISO26262 기준에 부합하는 관리 프로세스에 맞춰 다양한 방식의 안전 기능을 추가해 오토모티브향 NPU IP를 개발했다. 자율주행차는 향후 인간의 개입 없이 실시간으로 바뀌는 도로 환경에서 스스로 인지, 판단, 제어해야 하기에 더욱 안전하고 높은 신뢰성을 보장해야 한다. 이처럼 기능안전 표준에 부합하는 개발이 요구되는 상황에서 사피온은 기능안전 국제표준인 ISO26262 인증을 통해 전장부품의 고장이나 오작동을 최소화하고자 하는 시장 요구에 가장 잘 부합하면서도 포괄적이고 엄격한 프로세스 표준을 수립했다는 평가를 받게 됐다. 사피온은 자율주행 자동차용 AI NPU IP를 내년에 선보일 계획이다. 사피온의 데이터 센터용 X330과 신경망 처리
- 서재창 기자
- 2023-12-01 10:07
최신뉴스 초당 5천 조 연산하는 AI 개발... 연산성능 4배·전력효율 7배 ↑

헬로티 함수미 기자 | 한국전자통신연구원(ETRI)은 학습과 추론을 가속할 수 있는 시스템을 개발했다. 자체 개발한 AI 반도체를 활용한 결과이기에 더욱 의미 있는 결과다. 국내연구진은 고성능 AI 반도체 칩을 활용하여 낮은 전력으로 초당 약 5천조 회 연산이 가능한 인공지능 시스템을 개발했다. 사회 전반에 AI가 빠르게 도입됨에 따라 복잡하고 정교한 대규모 연산 처리의 필요성이 높아지고 있다. 하지만 기존 컴퓨터와 모바일에서 주로 활용된 중앙처리장치는 단순 계산에 최적화되어 있다는 한계가 있다. 이에 GPU가 주로 활용되고 있으나 구조적으로 인공지능 연산 처리에 최적화되어 있지 않아 데이터 지연 및 전력 낭비가 발생한다. NPU 기반 AI 반도체가 차세대 AI 두뇌로 떠오르는 이유다. ETRI는 작년 NPU 기반 AI 반도체 칩, AB9을 공개한 데 이어 올해 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위함이다. 연구진이 개발한 NPU 보드 ‘ABrain-S’는 AB9을 기반으로 독자적인 설계를 이뤄 부피가 작으면서도
- 함수미 기자
- 2021-12-02 10:09
최신뉴스 엑스페리, 엣지 추론 솔루션 기업 '퍼시브’ 출범…얼고 프로세서 출시

[첨단 헬로티] 엣지(Edge) 추론 솔루션 기업인 퍼시브 코퍼레이션(Perceive Corporation, 이하 퍼시브)은 오늘 회사를 출범시키고, 자사의 첫번째 제품인 Ergo (얼고) 엣지 추론 프로세서를 출시했다. Ergo는 보안 카메라, 스마트 가전제품, 휴대폰 같은 소비자 가전제품에 획기적인 정확성과 성능을 제공한다. Ergo 칩과 레퍼런스 보드는 현재 주요 고객에게 시제품이 제공되고 있으며, 올해 2분기에 양산 준비가 완료될 예정이라고 퍼시브 측은 밝혔다. 퍼시브는 전 세계 사용자들에 특별한 경험을 제공하는 스마트 기기를 위한 혁신적인 오디오, 이미징 및 반도체 기술을 제공하고 있는 엑스페리(Xperi)가 대다수의 주식을 소유한 자회사다. 소비자들이 점점 더 높은 보안과 프라이버시를 원하고 있는 가운데, Ergo는 센서 데이터를 기기에서 클라우드로 보내 분석해야 하는 필요성을 없애 준다. Ergo의 실시간 온 디바이스(on-device) 추론 프로세싱은 비디오나 오디오처럼 소비자 경험과 데이터 프라이버시가 매우 중요한 기기에 이상적이다. 보안 카메라의 잘못된 알림을 줄이거나 모바일 기기의 배터리 수명 연장, 혹은 가전 제품의 사용자 인터페이스를
- 이나리 기자
- 2020-04-02 10:15

이전

1

포토이슈

랭킹뉴스

상호명(명칭) : (주)첨단 | 등록번호 : 서울,자00420 | 등록일자 : 2013년05월15일 | 제호 :헬로티(helloT) | 발행인 : 이종춘 | 편집인 : 김진희 |
본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2012년 4월1일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호
copyright(c) HelloT all right reserved

UPDATE: 2026년 03월 10일 19시 04분