배너
닫기
배너

GPU만 앞세운 AI 스펙 경쟁, 이면에 놓치고 있는 것들

URL복사

정부가 1조8000억 원 규모의 추가경정예산을 편성하며 인공지능(AI) 인프라 확충에 시동을 걸었다. 그 중심에는 ‘GPU 1만 장’이라는 상징적 숫자가 있다. 엔비디아 H200, 블랙웰과 같은 최첨단 그래픽처리장치(GPU)를 국가 AI 컴퓨팅 센터에 도입해 국내 AI 생태계에 연산력을 공급한다는 목표다. 동시에 최대 5곳의 기업을 ‘국가대표 AI 모델(WBL)’ 개발사로 선정해 GPU, 데이터, 인재 등을 집중적으로 지원한다. 과연 GPU 물량 확보만으로 한국이 AI 강국이 될 수 있을까.



하드웨어 중심의 AI 전략의 명암


전 세계는 ‘AI 스펙 경쟁’에 돌입한 듯 보인다. 파라미터 수, 트레이닝 FLOPS, 연산 처리 속도 같은 수치가 기술력의 상징처럼 여겨진다. 하지만 반대로, 한국이 가진 연산능력이 늘어난다고 해서, 그것이 곧 고유한 AI 기술력과 경쟁력을 보장해줄 수 있을지에 대해서는 의문이다. 현재 AI 전략의 방향성이 스펙에만 집중돼 있는 것은 아닌지, 우리가 확보해야 할 보이지 않는 자산은 무엇인지 자문해볼 필요가 있다.

 

올해 11월부터 본격 가동되는 ‘국가 AI 컴퓨팅 센터’에는 추경을 통해 확보한 GPU 1만 장이 투입된다. 엔비디아의 최신 GPU인 H200과 블랙웰을 기준으로 설계된 이 프로젝트는 참여 기업이 모델 개발에 사용할 연산 자원을 국가가 직접 공급하는 방식이다. 이 중 일부는 AI 파운데이션 모델 개발을 추진할 ‘WBL(World Best LLM)’ 프로젝트 참여 기업에 우선 배정된다.​

 

하지만 AI 경쟁력이 GPU의 물리량으로만 결정되는 것은 아니다. 연산 자원을 어떻게 효율적으로 활용할 것인지, 어떤 모델을 어떤 데이터로 학습시키고 그것을 어떤 서비스에 연결할 수 있을지가 핵심이다. 오픈AI, 메타, 구글 등 글로벌 빅테크들은 자체 클러스터를 보유하고 있음에도 불구하고, GPU를 효율화하기 위해 자체 프레임워크를 개발하고 모델을 경량화하며, 연산 속도 대비 효과를 극대화하는 방향으로 최적화하고 있다.​ 무조건 많이 산다고 해서 기술력까지 확보되는 건 아니다. 오히려 GPU는 기회이자 도구일 뿐이며, 진짜 싸움은 그 다음이다.​

 

데이터, 한국 AI의 결정적 약점

 

GPU는 많아질 수 있다. 그러나 그 위에 올릴 수 있는 데이터는 쉽게 만들어지지 않는다. 현재 국내에서는 학습용 국문 데이터셋이 절대적으로 부족하며, 멀티모달 데이터나 사용자 상호작용 기반 데이터도 매우 제한적이다. 대부분의 스타트업은 한정된 웹 크롤링 자료나 기존 공개된 해외 데이터셋을 활용하며, 그마저도 라이선스나 품질 이슈로 인해 제한적이다.​

 

AI 스타트업 관계자는 “정부가 GPU를 대여해준다고 해도 학습시킬 고품질 국문 데이터를 구하는 데 한계를 느낀다”며 “양질의 데이터 없이 고성능 연산기를 확보해도 효과는 미미하다”고 말했다. 실제로 메타는 Llama 시리즈 개발을 위해 수천억 원을 들여 자체 데이터셋을 구축하고, 라이선스가 명확한 콘텐츠만을 활용하도록 정책화했다.​

 

한국 정부도 저작권 클리어링이 완료된 학습용 데이터 공동 구매를 검토하고 있지만, 여전히 수요 대비 규모가 작고, 텍스트 이외의 데이터 확보 전략이 부족하다는 지적이 나온다. AI는 연산이 아니라 맥락을 배우는 기술이며, 이 맥락을 구성하는 것은 결국 데이터다.​

 

오픈소스 커뮤니티 부재, 협업은 어디로부터?

 

AI 기술은 독점적으로 닫힌 생태계에서 탄생하지 않는다. 미국과 프랑스, 유럽연합 등에서는 오픈소스 LLM과 이를 둘러싼 커뮤니티가 빠르게 성장하고 있다. 대표적으로 프랑스의 미스트랄, 미국의 투게더AI, 허깅페이스 등은 모델 자체를 공개하고, 다양한 개발자와 공동 실험을 거듭하며 성능을 높인다.​ 반면 한국의 AI 오픈소스 생태계는 최근 몇 년 사이 일부 성과와 시도가 있었지만, 글로벌 수준에 비해 미성숙하고 단편적인 수준에 머물러 있다. 특히 미국, 프랑스, 캐나다 등과 비교하면 생태계 규모, 기여 문화, 지원 인프라, 정책적 연계성 면에서 뚜렷한 한계가 있다.

 

이뿐 아니라 한국에서는 공개형 LLM 혹은 오픈 멀티모달 모델 개발 사례가 드물다. 정부 과제 역시 결과물의 오픈소스화를 요구하지 않으며, 민간 기업 역시 코드나 가중치를 공개하지 않는 경우가 대부분이다. 이는 AI 기술의 네트워크 효과를 원천적으로 차단하는 결과를 낳는다.​

 

생태계는 기술이 아니라 문화로 성장한다. 단순히 GPU와 모델만 갖춰진다고 해서 생태계가 만들어지지 않는다. 오픈소스와 재현 가능한 실험, 커뮤니티 중심 의 협업 구조가 함께 성장해야 진정한 기술 자립이 가능하다. 현재 한국에서는 이러한 공공 기술 생태계가 미성숙한 상태에 머물러 있다. 업계에서는 “오픈소스화에 대한 유인이 없고, 공동으로 실험할 수 있는 공유 인프라도 부족하다”고 언급했다.


2024년 이후 세계 AI 생태계는 크기보다 효율의 싸움으로 전환되고 있다. 한국에서도 새로운 방식의 AI 연산 생태계를 구축하려는 시도가 있다. 대표적으로 퓨리오사AI는 자체 개발한 NPU ‘워보이’를 활용해 클라우드 기반 AI 서비스의 연산 최적화를 추진하고 있다. 리벨리온은 자체 AI 칩 ‘아톰’을 서버·클라우드용으로 상용화하고, 미국 대형 반도체 기업들과 협력 관계를 구축해 해외 진출 기반을 마련하고 있다. 업계에서는 국내 AI 정책이 GPU 위주로만 설계되기 보다 기술적 다양성을 살릴 수 있는 지원이 필요하다고 언급했다.

 

이러한 상황에서 AI 전략이 단순히 스펙 경쟁에 몰두하기보다 개발을 촉진할 수 있는 생태계와 문화 조성에도 힘써야 할 필요가 있다. 다시 말해 AI는 연산 속도와 메모리 용량의 싸움이 아니라, 데이터를 바라보는 철학, 협업을 촉진하는 구조, 그리고 기술의 활용을 뒷받침하는 사회적 자본의 싸움이기도 하다. GPU는 중요하다.

 

하지만 그 위에 무엇을 올릴 것인지, 누가 함께 그것을 활용할 것인지가 기술 경쟁력을 좌우한다. AI 강국은 더 많은 칩을 가진 나라가 아니라, 더 넓은 생태계를 갖춘 나라다. 한국이 AI G3로 도약하기 위해서는 협업의 문화, 공유의 철학, 그리고 기술을 둘러싼 질문을 던질 수 있는 생태계가 필요해 보인다.

 

헬로티 서재창 기자 |









배너









주요파트너/추천기업