미래 시장 형성해가는 LLM 사업 뛰어드는 기업들
거대언어모델이라 불리는 'LLM(Large Language Model)'은 일반인에게도 익숙한 용어가 됐다. 쉽게 말해 LLM은 컴퓨터 프로그램의 일종으로, 인간처럼 언어를 이해하고 생성하는 능력을 갖춘 AI 모델을 의미한다. 이 모델은 방대한 텍스트 데이터를 학습해 글을 읽거나 생성한다.
LLM이 대중에게 익숙해지게 된 계기는 오픈AI가 개발한 챗GPT 덕분이다. 챗GPT는 자연어 이해와 생성 작업을 수행하는 데 LLM으로, 출시된지 5일 만에 가입자 100만 명을 돌파하는 기염을 토했다. 단순히 저장된 데이터를 통해 정보를 제공하는 수준이 아닌 구체적인 질문에 대한 신속하고 정확한 답변을 제공한다는 점에서 놀라움을 자아냈다.
물론 LLM은 아직 완벽하지 않다. 학습된 데이터에 기반해 작동하기에 정확성과 품질에 있어 한계를 나타내곤 한다. 그러나 이마저도 추가적인 데이터와 개발자의 파드백을 통해 성능을 개선시킬 수 있으므로 현재보다 미래가 기대되는 기술이다.
국내 주요 기업들은 시장 잠재성이 확인된 LLM을 자체 개발하기에 나섰다. 무엇보다 오픈AI, 구글, 마이크로소프트 등 주요 빅테크가 선보인 LLM은 한국어 데이터가 현저히 부족하기에, 국내 기업들은 한국어에 최적화한 LLM을 개발하는데 초점을 맞추고 이를 기반으로 한 다양한 서비스를 계획하고 있다.
네이버는 지난 8월 24일 개최한 ‘DAN 23’에서 생성형 AI ‘하이퍼클로바X’와 이를 기반으로 한 대화형 AI 서비스 ‘클로바X’, 생성형 AI 검색 ‘큐(CUE):’를 소개했다. 이와 함께 공개된 기술들을 적용한 검색, 커머스, 광고 등 네이버 주요 서비스들도 공개됐다.
네이버가 강조한 것 중 하나는 하이퍼클로바X가 한국어에 최적화한 국산 LLM이라는 점이었다. 한 예로, 하이퍼클로바X는 GPT-3.5와 비교해 한국어를 약 6500배 많이 학습한 것으로 알려졌다. 네이버 최수연 대표는 자사의 광범위한 개인화 데이터를 강조하며, AI 경쟁력에 대한 확신을 내비쳤다.
카카오도 올해 하반기에 자회사 카카오브레인을 통해 한국어 특화 초거대 AI 모델 '코GPT'의 업그레이드 버전인 '코GPT 2.0'을 공개할 예정이다. 이를 바탕으로 카카오브레인은 AI 챗봇 서비스 '코챗GPT'도 하반기에 출시할 계획이다. 카카오 홍은택 대표는 지난 5월 1분기 컨퍼런스콜에서 코GPT 2.0에 대해 "파라미터나 데이터가 부족할 수 있지만, 한국어 특화한 모델로는 부족함이 없을 것"이라고 밝힌 바 있다.
이에 카카오페이 신원근 대표는 지난 5월 기자간담회를 통해 "생성 AI 기술을 토대로 한 '금융비서 AI' 연구를 진행하고 있다"며, "카카오 공동체에서 준비 중인 '코GPT 2.0'에 금융 정보를 학습시킴으로써 금융비서가 탄생할 것"이라고 말했다.
LG AI연구원은 지난 7월 초거대 인공지능(AI) '엑사원(EXAONE) 2.0'을 공개하며 '상위 1% 전문가 AI'를 목표로 내세웠다. 특히 초거대 AI의 고비용 이슈를 해결하고자 대규모 언어 모델(LLM), 이미지와 언어 등 여러 정보를 동시에 처리하는 멀티모달 모델의 경량화에 힘을 쏟았다.
엑사원 2.0은 특허와 논문 등 전문 문헌 약 4500만건과 이미지 3억5000만 장을 학습했다. 또한, 한국어와 영어를 동시에 이해하고 답변하는 '이중 언어 모델'로 개발됐다. LG AI연구원은 엑사원 2.0의 언어 모델이 기존 모델과 같은 성능을 유지하면서 추론 처리 시간은 25% 단축하고 메모리 사용량은 70% 줄여 비용을 약 78% 절감했다고 밝혔다.
SK텔레콤(이하 SKT)은 자체 LLM에 협력사의 모델을 결합한 '멀티 LLM' 전략을 발표했다. 이에 SK텔레콤은 기업 및 공공기관의 수요에 따라 LLM이 가진 특·장점을 발휘하도록 서비스를 연결하는 산업별 특화 LLM 서비스를 제공할 예정이다.
최근 SKT는 한국어 기반 자체 LLM '에이닷'의 기업용 파운데이션 모델을 선보였으며, 고객사 대상 학습 및 최적화 작업을 진행 중인 것으로 알려졌다. 에이닷 LLM은 학습한 데이터와 서비스 특성상 대화와 챗봇 등 통신사형 서비스에 강점을 보인다. 여기에 자료 입력 시 최대 7만5000단어까지 입력하는 엔트로픽 LLM과 한국어 데이터가 상대적으로 풍부한 코난테크놀로지스 LLM을 더했다.
KT 역시 미래 경쟁력을 갖추기 위해 초거대 AI '믿음'의 기술력 확보와 AI 사업 확장에 나서고 있다. 앞서 KT는 오는 10월경 믿음을 출시할 계획이라고 밝혔다. 믿음은 파라미터가 2000억 개 이상에 이를 것으로 알려졌다.
이뿐 아니라 KT는 지난 6월 기자간담회를 통해 "AI 추진 방향은 고객과 산업의 수요에 따라 가장 적합한 ‘고객중심의 맞춤형 AI 서비스’를 선보이는 ‘AI 서비스 프로바이더’가 되겠다"고 밝혔다. 이에 KT는 로봇과 헬스케어, 교육 등으로 AI 사업을 확대해 2025년에는 관련 부문 매출 1조3000억 원을 달성한다는 목표를 세웠다.
엔씨소프트도 지난 8월 16일 자체 AI 언어모델 ‘VARCO’를 발표하며 LLM 경쟁에 가세했다. VARCO는 “AI를 통해 당신의 독창성을 실현하세요(Via AI, Realize your Creativity and Originality)라는 의미를 가진 엔씨 AI 언어모델의 통합 브랜드 명칭이다.
VARCO 브랜드로 운영되는 자체 언어모델(LLM)의 종류는 크게 기초 모델(Foundation), 인스트럭션 모델(Instruction), 대화형 모델(Dialogue), 생성형 모델(Generative)로 나뉜다. 각 LLM은 매개변수 규모에 따라 성능이 구분된다. 엔씨소프트는 한국어와 영어 모두 사용할 수 있는 이중언어 모델도 이달 안에 선보일 예정이며, 이후 순차적으로 규모 별 언어모델을 종류에 맞춰 공개할 계획이다.
헬로티 서재창 기자 |