AI 반도체 시장이 확장하고 있다. AI 반도체는 IoT, 자율주행, 웨어러블 등 첨단 산업에서 빼놓을 수 없는 핵심 요소다. 다만 확장된 기능만큼 처리하는 데이터도 방대하다. 이에 그래프코어가 개발한 IPU는 뛰어난 데이터 처리량과 낮은 전력 소비로 업계로부터 주목받고 있다. 그래프코어 강민우 지사장을 만나 IPU가 가진 잠재력과 시장에서의 역할에 대해 이야기 나눠봤다.
그래프코어는 어떤 회사인가?
2016년 창립한 그래프코어는 AI 반도체 회사면서 AI 관련 소프트웨어 툴킷을 제공하는 기업이다. 특히 지능처리장치(Intelligence Processing Unit, 이하 IPU)를 개발해 주목을 받았다. 그래프코어의 설립자는 통신칩 분야 유니콘 기업이었던 아이세라의 창업주였으며 이후 엔비디아로 인수가 됐고, 엔비디아에서 재직하는 동안 통신칩 개발을 추진했다.
그는 GPU가 갖는 제약사항을 주목했고, 이를 극복할 수 있는 AI 반도체를 만들고자 그래프코어를 설립했다. 우리의 IPU 시스템은 다양한 AI 연산과 추론 태스크에서 월등한 성능을 보인다. 현재 생산은 TSMC와 폭스콘에서 주관하고 있다.
그래프코어는 거액의 투자 유치로도 유명하다.
그래프코어는 현재까지 7억 달러 달러 이상을 누적 투자를 달성했다. 기업이나 기관에서 투자를 결정함에 있어 중요한 요소 중 하나는 창업주다. 그래프코어의 창업주가 업계에서 이미 인정받고 있었기에 설립 초기부터 많은 투자금을 유치할 수 있었다. 물론 반도체 기업 특성상 기술 개발과 인프라 구축에 많은 비용이 소요되기에 현재에도 추가 펀딩이 예정된 상태다.
그래프코어가 한국 시장을 바라보는 시각은 어떤가?
반도체 시장에서 미국과 중국을 제외하면, 영국, 프랑스, 그리고 우리나라의 기술 수준은 선두에 있다. 정부의 반도체 산업 투자도 세계 시장에서 손꼽히는 수준이다. 여기에는 정부 주도 사업이나 스타트업을 활성화하는 방안이 포함된다. 그런 측면에서 우리나라는 다른 나라와 차별성이 있는 지역이다. 이를 인지한 그래프코어는 아시아 지역에서 중국 다음으로 우리나라에 지사를 설립하기도 했다. 일본, 싱가포르, 인도보다 1년 정도 빨리 설립됐다.
AI 반도체 개발은 어떤 과정을 거치는가?
일반적으로 AI 사업은 오랜 시간을 필요로 한다. 트위그팜의 경우 AI 모델에 대한 알고리즘을 최적화하고, 그 모델을 IPU에 최적화하는 작업, 데이터셋을 가져와 튜닝하는 작업 등을 수행하는데 6개월 이상 걸렸다. 완성된 모델을 학습시키는 시간도 필요하며, AI 모델의 사이즈가 클수록 시간은 당연히 더 오래 걸린다.
변수도 존재한다. 이에 대형 프로젝트는 최소 1년에서 1년 반가량 소요된다고 봐야 한다. 중요한 것은 AI 학습을 통해 서비스형 모델을 만드는데 얼마만큼의 시간과 비용이 드는지 고민해야 한다. 우리가 개발한 IPU는 시간과 비용을 줄이기 위해 만들어졌으며, 업계에서도 IPU를 적용하는 사례들이 점차 늘고 있다.
그렇다면, 그래프코어 IPU는 어떤 차별성을 갖는가?
최근 개발된 ‘보우(Bow) IPU 칩’은 기존 제품과 코어 수는 같으나 40% 향상된 성능과 16% 뛰어난 전력 효율을 갖췄다. 웨이퍼 두 개를 쌓는 방식인 3D 웨이퍼-온-웨이퍼 기술이 적용됐으며, 차세대 보우 POD AI 컴퓨터 시스템의 핵심이다. 플래그십 제품 Bow POD과 초대형 Bow POD의 경우 각각 89페타플롭스와 350페타플롭스의 AI 연산을 지원한다.
한편, 그래프코어는 하드웨어 개발뿐 아니라 소프트웨어에 초점을 맞췄다. 우리를 포함해 엔비디아나 구글 모두 동작하기 위한 별도의 SDK가 있다. 핵심은 개발자가 SDK를 손쉽게 사용할 수 있게 만드는 것이다. 이에 그래프코어는 개발자의 원활한 활용을 위해 논문으로 발표된 다양한 AI 알고리즘 모델을 우리 쪽에 맞게 번역해 포팅 작업을 진행했다.
ETRI와의 협력에서도 ‘개발자의 편의성’이 강조됐다.
그렇다. 그래프코어와 ETRI는 AI 컴퓨팅을 위한 한국형 소프트웨어를 만들고자 손을 잡았다. 양사의 파트너십은 AI 컴퓨팅 성능, 효율성, 접근성을 개선하는 동시에 시스템 및 기술에 대한 소유 부담과 의존성을 줄이는 새로운 소프트웨어 접근법을 개발하는데 목적을 둔다.
이를 위해 양사가 주목하는 세 가지 영역은 컴퓨팅 리소스 관리 부담 최소화, 독립적인 개발 환경 조성, 개발 편의성 향상이다. 즉 개발자가 손쉽게 쓸 수 있는 SDK를 만드는 것이다. 여기에 장기적으로는 초대형 모델을 쉽게 포팅할 수 있도록 개발 계획을 구상하고 있다.
그래프코어가 구상하는 거대 모델인 ‘굿 컴퓨터’ 개발 로드맵도 궁금하다.
AI 초거대 모델이 수많은 파라미터를 처리하려면, 병렬 컴퓨팅이 중요하다. 그에 대한 대안이 굿컴퓨터다. 우리는 오는 2024년 초지능 AI 컴퓨터인 굿컴퓨터를 출시할 계획이다. 굿컴퓨터는 10엑사플롭스 이상의 AI 부동소수점 연산을 지원하고, 초당 10페타바이트 이상의 대역폭으로 최대 4페타바이트의 메모리를 제공할 것으로 추정된다. 굿컴퓨터를 사용하게 될 기업이나 기관은 한정적이기에 전략적인 접근이 필요할 것으로 보인다.
AI 반도체 개발에 있어 장벽으로 생각되는 점은 무엇인가?
기술에 대한 선입견이 가장 크다. 아직 업계에서조차 IPU는 생소한 개념이다. 특히 엔비디아 GPU가 이미 시장을 장악하고 있기에 새로운 시장에 대한 니즈를 끌어내는 과정이 반드시 필요하다. 다만, 앞으로는 지금보다 훨씬 방대한 데이터를 다룰 수 있는 컴퓨팅 시스템이 요구될 것이다.
이에 IPU는 투자 대비 효율을 극대화하는 제품이다. 우리는 국책과제 등을 수행해 보다 적극적으로 기술을 알릴 것이며, 특히 개발자 커뮤니티 활성화를 위해 경진대회 개최 등을 고려하고 있다.
끝으로, 당사의 하반기 계획과 중장기 목표를 듣고 싶다.
그래프코어는 기존 시장 제품과 칩 구조나 소프트웨어를 개발하는 방법이 모두 다르기에 이를 지원하기 위한 조직 확장을 고려하고 있다. IPU를 활성화하기 위한 인력을 확보하기 위해 하반기 이후부터는 개발자 위주로 채용을 진행할 예정이다. 이와 함께 각 지역에서 활성화하는 AI 개발과 관련한 사업들을 주목해 지자체, 대학, 연구소 등의 기관과 협업할 계획이다.
한편, 그래프코어는 현재 제품이 4세대까지 개발됐으며, 범용으로 사용되고 있다. 앞으로는 앞서 언급했듯이 개발자의 편의성을 고려한 소프트웨어를 만드는데 주력할 예정이다. 굿컴퓨터가 나오는 시점인 2024년경에는 새로운 칩도 발표될 것이다. 그렇게 되면, 시장에 많은 변화가 있을 것으로 예상된다.
헬로티 서재창 기자 |