닫기
배너

[헬로AI] AI 추론 최적화 한계 돌파하는 에너자이 “오라, 온디바이스 시대”

URL복사

에너자이 정현우 CSO 인터뷰

 

빅테크 중심으로 AI 기술이 폭발적으로 진화하는 지금, 소프트웨어 최적화와 하드웨어 제약을 모두 고려한 AI 추론이 기술 경쟁의 핵심으로 떠오르고 있다. 에너자이는 AI 추론 성능을 극대화하는 자체 엔진 ‘옵티미엄(Optimium)’으로 AI 기술의 실용성과 확장 가능성을 동시에 확보하며 주목받고 있다. 학습보다 추론이 중심이 되는 시대, 에너자이의 기술은 주요 반도체 팹리스·IP 기업과의 협업을 기반으로 빠르게 확장 중이다. 



손 안에 AI, 최적화와 양자화 주목하다

 

AI 기술은 온디바이스 환경에서 성능을 구현하는 추론 영역을 주목한다. AI 추론은 학습 모델을 기반으로 데이터를 처리해 결과를 도출하는 과정이며, 추론의 속도와 효율은 제품 사용성과 직결된다. 특히 엣지 환경이나 온디바이스 구조에서는 고사양 GPU 없이 AI 기능을 구동해야 하기에 경량화와 최적화 기술이 필수적이다.

 

에너자이는 바로 이 지점에 주목해 옵티미엄을 중심으로 하드웨어와 소프트웨어의 결합 최적화 전략을 내세웠다. 에너자이 정현우 CSO는 “AI 기술은 이제 연구실 밖으로 나왔다. 진짜 승부는 ‘현실 환경에서 얼마나 빠르고 가볍게 AI를 실행하는가’에 달렸다. 우리는 그 현실에 가장 근접한 기술을 갖췄다”고 자부했다.

 

온디바이스 AI 기술의 핵심 난제는 고도화한 AI 모델을 전력과 메모리 제약이 있는 환경에서 어떻게 실질적으로 구동하느냐는 점이다. 서버급 연산 성능이 없는 디바이스에서 대규모 AI 모델, 특히 GPT나 LLaMA 계열의 생성형 모델을 운영하는 것은 지금까지는 거의 불가능한 과제였다. 에너자이는 이러한 기술적 제약을 극복하기 위해 두 가지 방향의 혁신을 추진했다.

 

첫 번째는 양자화 기술의 고도화다. 대다수의 AI 모델은 16비트 또는 32비트 연산에 기반하지만, 에너자이는 이러한 규모가 큰 모델들을 정확도 손실을 최소화하면서 4비트 이하로 양자화하는 데 성공했다. 또한, 4비트 이하로 양자화된 모델을 대상 하드웨어에서 최적으로 실행할 수 있도록, 옵티미엄을 활용해 최적화된 커널을 결합함으로써 작지만 성능이 뛰어난 AI 구현에 대한 해답을 제시했다.

 

두 번째는 대상 하드웨어에 대한 자동 최적화다. 옵티미엄은 디바이스에 연결된 칩셋의 구조, 연산 단위, 메모리 구조를 자동 분석하고 이에 맞는 최적의 추론 구조를 구현한다. 이로 인해 동일한 AI 모델이라도 각각의 디바이스에 최적화한 형태로 실행되며, 고속성과 저전력 효율을 동시에 달성한다.

 

특히 특히 옵티미엄을 통해 추론 최적화를 거친 모델은 스마트 기기, 차량, 드론, 산업용 IoT 등 다양한 환경에 유연하게 적용될 수 있도록 설계된 점에서 기술의 확장성이 높다. 이러한 기술을 기반으로 에너자이는 다양한 기업과 공동 솔루션 개발 및 글로벌 적용 사례를 확대하며, 기술 상용화 단계에 본격적으로 진입하고 있다.

 

 

온디바이스 한계 넘는 AI 추론 엔진 ‘옵티미엄’

 

정현우 CSO는 “옵티미엄은 단순한 엔진이 아니라, AI 추론 최적화의 기준점이 되고자 한다. 우리는 옵티미엄의 지원 범위와 성능을 빠르게 고도화하고 있다”고 말했다. 기존에는 주로 CPU를 기반으로 최적화를 진행했지만, 올해 안에 GPU까지 최적화 범위를 확장한다는 계획이다. AI 추론 최적화의 핵심은 기술적 복잡성과 하드웨어의 한계를 동시에 넘는 것이다.

 

이에 에너자이는 ‘나디야(Nadya)’라는 새로운 형태의 메타프로그래밍 언어를 개발했고 이를 기반으로 옵티미엄을 구현했다. 일반적인 AI 추론 엔진은 모델을 구성하는 각 레이어에 대해 매우 긴 코드를 작성해놓고 필요할 때 미리 정해진 긴 코드를 호출해 실행하는 방식이지만, 이는 신모델 등장 속도가 빠른 현재 AI 생태계에서는 비효율적일 수밖에 없다.

 

나디야는 AI 모델의 구조를 읽고, 상황에 맞는 최적화 코드를 자동으로 생성한다. 나디야로 생성된 코드는 옵티미엄의 ‘Optimization pass’를 거쳐 하드웨어에 최적화한 형태로 변환된다. 나디야의 메타프로그래밍 언어로서 특성과 옵티미엄 고유의 추론 최적화 레시피를 통해 기존 엔진 대비 훨씬 높은 성능과 유연성을 동시에 확보하게 된다. 이 구조는 새로운 AI 모델이 등장해도 빠르게 대응하며, 디바이스마다 다른 칩셋 환경에서도 성능 저하 없이 운영된다.

 

옵티미엄은 하드웨어 제약이 큰 환경에서도 고성능 AI를 안정적으로 구현하는 핵심 기반으로 작용하고 있다. 4비트 미만의 극저비트 모델은 온디바이스 환경에서 고성능 AI를 실현할 수 있는 해결책이 될 수 있으나, 현재 이를 지원하는 엔진이 시장에 거의 전무한 실정이다.

 

하지만, 옵티미엄은 높은 유연성을 바탕으로 다양한 정밀도의 모델을 지원할 수 있기에 4비트 미만의 모델도 지원하는 기술적 차별점이 지닌다. 이에 에너자이는 고도화한 양자화 기술과 옵티미엄 기반의 최적화한 커널을 결합해 정확도 손실을 최소화하면서도 메모리 및 전력 사용량을 획기적으로 줄이는 온디바이스 AI를 가능케 하고 있다.

 

실제로 에너자이는 오픈AI의 음성인식 모델 ‘위스퍼(Whisper)’를 1.58비트로 양자화해 시냅틱스 및 르네사스의 SoC에 탑재된 CPU에서 구동시킴으로써 기존 대비 2배 이상 빠른 속도와 4배 이상 낮은 메모리 사용량을 구현한 바 있다. 이는 하드웨어 제약이 큰 환경에서도 고성능 AI를 안정적으로 운영한다는 가능성을 증명한 사례다.

 

증명받은 성과, 이제는 ‘AI 추론의 범용화’다

 

에너자이의 기술력은 업계로부터도 주목받기 시작했다. 상징적인 성과는 올해 Edge AI and Vision Alliance로부터 ‘올해의 제품상’을 수상한 것이다. 세계적으로 권위를 인정받는 이 시상식에서 에너자이는 ‘최고의 Edge AI 개발 플랫폼’ 부문 수상자로 이름을 올렸다.

 

이 상은 기술력 평가를 넘어 실제 산업 혁신에 기여한 기술을 선정하는 방식으로 운영된다. 정현우 CSO는 “에너자이가 수상하게 된 배경에는 옵티미엄이 구현해낸 속도, 전력 효율 등의 총체적인 성과가 있었다. 이는 AI 시장의 무게 중심이 학습에서 추론으로 이동하고 있다는 인식과도 맞물려 있다”고 말했다.

 

수상 이후 에너자이는 주요 반도체 기업 및 디바이스 제조사와 기술 협업 요청을 받으며, 이를 계기로 북미, 일본, 유럽 시장에서 사업 확장을 가속화하고 있다. 기술과 시장 모두에서 인정받기 시작한 지금, 옵티미엄은 단순한 엔진이 아닌 AI 추론 생태계의 허브로 자리잡을 가능성을 열고 있다.

 

이에 에너자이는 AI 추론의 범용화를 목표로 다양한 비즈니스 모델을 확장하고 있다. 핵심은 온디바이스 AI 시장에서의 확고한 입지 구축이다. 이를 위해 에너자이는 옵티미엄 외에도 다양한 고성능 온디바이스 AI 모델을 지속적으로 개발하며, 이를 통해 고객사의 디바이스 환경에서 즉시 사용할 수 있는 포괄적 솔루션을 제공하고 있다.

 

정현우 CSO는 “AI 추론 기술의 진화는 향후 멀티모달 AI, LLM, VLM 등 다양한 형태의 AI 융합 기술로 확장될 것이다. 우리는 이러한 흐름 속에서 기술 중심 기업으로서의 정체성을 강화하고 있다”고 말했다. 이어 그는 “특히 ‘모든 이들이 모든 사물을 통해 어디서든 최고의 AI를 경험하도록 하자’는 비전을 바탕으로, AI 기술의 보편성과 접근성을 높이는 데 집중할 것”이라고 덧붙였다.

 

에너자이는 AI 기술이 특정 환경이나 기업에 국한되지 않고, 누구나 사용할 수 있는 공공재적 인프라로 확산되기를 지향하며, 이를 현실로 구현해내기 위한 기술, 인재, 파트너십을 적극적으로 확장할 것으로 기대된다.

 

헬로티 서재창 기자 |













배너

배너


배너


주요파트너/추천기업