닫기

기획특집

배너

‘5빅5색’ 그들의 생성형 AI가 겨냥하는 시장은?

URL복사


2024년에도 빅테크의 진격은 계속된다. 빅테크가 연이어 발표하는 생성형 AI 기술은 기존 모델 성능을 가뿐히 뛰어넘으며 새로운 기능을 선보이고 있다. 텍스트를 넘어 음성 및 이미지, 영상 등을 생성하며 다양한 산업 분야에 적용 사례를 만들고 있다. 최근 빅테크가 발표한 생성형 AI 서비스 역시 일상의 편의와 업무환경의 혁신을 가져옴으로써 변화를 만들어내고 있다. 이처럼 생성형 AI는 빅테크가 쏟아붓는 막대한 예산과 그에 따른 기술개발이 낳은 결정체라고 해도 과언이 아니다. 



구글, 제미나이 1.5 프로의 등장

 

구글이 자체 개발한 멀티모달 AI 모델 제미나이 1.0 프로의 업데이트 버전을 공개했다. ‘제미나이 1.5 프로’는 구글 최신 AI 모델인 ‘제미나이 1.0 울트라’와 비슷한 성능으로 텍스트·이미지·음성·영상을 생성하는 중형 멀티모달 모델이다. 구글은 제미나이 1.5 프로가 기존 1.0 프로보다 동시에 정보를 처리하는 능력이 향상돼 긴 문맥을 이해하는 역량이 뛰어나다고 밝혔다.

 

제미나이 1.5 프로는 최대 100만 개의 토큰 처리 능력을 갖춘 것으로 알려졌다. 이는 기존 1.0 프로가 수행하는 3만2000개의 토큰 처리 규모를 아득히 뛰어넘는 수준이다. 1시간 분량의 동영상과 11시간 분량의 음성 파일, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트에 해당하는 방대한 정보를 한 번에 처리한다. 제미나이 1.5 프로는 개발자를 위한 AI 개발 도구인 ‘구글 AI스튜디오’와 기업들이 AI 모델을 활용하는 플랫폼 ‘버텍스 AI’를 통해 프리뷰 버전으로 제공된다. 

 

가벼운 생성형 AI 초점 맞춘 MS

 

마이크로소프트(MS)가 오픈AI의 챗GPT보다 작고 적은 비용으로 실행하는 AI 모델 개발에 나선 것으로 알려졌다. 디인포메이션에 따르면, MS는 최근 챗GPT 같은 생성형 AI를 자체적으로 개발하기 위해 새로운 생성형 AI 개발팀을 꾸렸다고 전했다. 미샤 빌렌코 수석 부사장이 이끄는 이 AI 팀은 챗GPT와 같이 사람의 질문에 응답하면서도 작고 저렴하게 실행하는 모델 개발(SLM)을 목표로 한다. 

 

이 모델은 챗GPT나 MS의 AI 챗봇인 코파일럿과 기능은 비슷하면서도 많은 양의 데이터나 비용을 투입할 필요는 없다. 한편, MS는 2019년 오픈AI와 파트너십을 구축한 이후 130억 달러(약 17조 원)를 투자하며 지분 49%를 보유하고 있다. 이에 오픈AI가 개발한 대규모언어모델(LLM)을 기반으로 AI 기능을 제품에 탑재하면서 전 세계 AI 열풍을 주도하고 있다. 

 

아마존, AI 기반 쇼핑 챗봇 선보여

 

아마존은 자사 웹사이트에서 생성형 AI 기반 대화형 쇼핑 도우미 ‘루퍼스(Rufus)’를 출시한다고 밝혔다. 아마존은 루퍼스가 자사의 방대한 제품 목록과 고객 상품평, 온라인상의 각종 정보를 학습했으며, 고객의 쇼핑 요구 사항을 포함해 제품을 비교한 내용을 바탕으로 최적의 제품을 추천해준다고 설명했다. 

 

루퍼스는 고객이 요구하는 특수한 상황이나 요구사항에도 맞춤형 답변이 가능한 것으로 알려졌다. 이 서비스는 아마존 모바일 앱을 사용하는 일부 고객을 대상으로 베타 버전이 출시됐으며, 몇 주 내에 미국 전체 고객을 대상으로 확대될 예정이다.

 

아마존은 자사 서비스가 아직 완벽하지 않기에 개선해갈 것을 언급했다. 한편, 아마존은 여러 사업 부문에서 생성형 AI 도구와 서비스를 잇달아 내놓고 있다. 지난해 4월에는 클라우드 서비스로 AI 개발 플랫폼 ‘베드록(Bedrock)’, 지난해 11월에는 기업 고객을 위한 AI 챗봇 ‘큐(Q)’를 선보인 바 있다.

 

AI 기능 살리기 나선 애플

 

블룸버그통신은 복수의 익명 소식통을 인용해 애플이 주력 프로그래밍 소프트웨어 ‘엑스코드(iOS와 OS X를 위한 통합 개발환경)’의 차세대 버전 일부로 해당 코딩도구를 개발 중이며 사내에서 시험 사용하고 있다고 보도했다. 소식통은 이 코딩도구가 MS의 깃허브 코파일럿과 비슷한 식으로 작동하며 인공지능을 활용해 코드를 예측·완성할 수 있다고 설명했다. 이를 통해 애플리케이션이나 소프트웨어 개발 과정을 단순화해 시간과 비용을 줄인다는 것이다. 

 

애플은 이르면 올해에 이 코딩도구를 시장에 공개하는 것을 목표로 개발에 나선 것으로 알려졌다. 블룸버그는 일반적으로 6월경 열리는 애플의 연례 개발자 콘퍼런스에서 관련 발표가 있을 것으로 예상했다. 이밖에도 애플은 차세대 맥OS에 AI 기능을 도입하고, 애플뮤직의 재생목록을 자동으로 만들어주는 AI 기능도 연구 중이다. 음성비서 서비스 시리가 복잡한 질문에 정확히 답하도록 LLM 개발에 나서며 검색 시스템 스포트라이트 개선도 검토 중인 것으로 알려졌다. 

 

오픈AI ‘텍스트에서 영상으로’

 

오픈AI는 텍스트를 동영상으로 만들어주는 AI 시스템을 발표해 화제를 모았다. 오픈AI는 자사 블로그를 통해 이 AI 시스템의 이름을 ‘소라(Sora)’라며 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작한다”고 밝혔다. 이와 함께 “언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 캐릭터를 생성한다”고 설명했다.

 

소라는 텍스트만으로 동영상을 생성하고 기존 이미지를 동영상으로 생성한다. 기존 동영상을 확장하거나 누락된 프레임을 채울 수 있다. 오픈AI 샘 올트먼 CEO는 “다만 이 AI는 초기에 제한된 수의 창작자만 사용하도록 허용됐다”고 밝혔다. 이후 오픈AI는 소라를 회사의 제품에 통합하기 전에 전문가팀에 맡겨 안전성 여부를 평가할 계획이다. 

 

헬로티 서재창 기자 |









배너










주요파트너/추천기업