닫기

일반뉴스

배너

‘이미지를 텍스트로’ LG AI연구원, AWS 기반 AI 솔루션 출시

URL복사

 

아마존웹서비스(이하 AWS)는 30일 AWS 리인벤트(re:Invent) 2023에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS 기반의 AI 이미지-투-텍스트(image-to-text) 캡셔닝 솔루션을 출시했다고 발표했다. 

 

신규 캡션 솔루션은 3000억 개의 파라미터를 보유한 LG AI연구원의 멀티모달 파운데이션 모델(FM)인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전 세계 고객을 위해 보다 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다.

 

엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 사용해 인간의 인지 능력과 유사하게 이전의 경험과 지식, 훈련을 바탕으로, 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어와 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력을 활용해 정확하고 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다. 

 

광고와 같은 산업군에서는 LG AI연구원의 기술을 활용해 제품 설명을 자동화하거나 광고·마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다. LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는 등 필요에 따라 비용 효율적으로 IT 리소스를 확장할 수 있도록, 안전하고 조정 가능한 컴퓨팅 용량을 클라우드에서 제공하는 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)를 사용한다.

 

소비재 기업, 마케팅 에이전시 등 LG AI연구원의 고객들은 AWS의 확장성을 활용해 시간당 2000개 이상의 이미지 캡션을 생성할 수 있다. LG AI연구원은 머신러닝(ML) 모델을 구축·훈련·배포하는 완전 관리형 서비스 아마존 세이지메이커(Amazon SageMaker)를 사용해 3억5000만 개의 고해상도 이미지와 텍스트 세트를 엑사원에게 학습시켰다. 

 

LG AI연구원은 클라우드를 사용해 온프레미스 인프라보다 더 빠르고 저렴한 비용으로 결과를 미세 조정하고 체크포인트를 구현하며, 데이터 편향과 같은 문제를 신속하게 해결할 수 있었다.

 

이화영 LG AI연구원 상무는 "LG AI연구원의 엑사원은 크리에이티브 분야에서 생성형 AI를 더 쉽게 활용할 수 있게 해주는 강력한 도구"라며 "AWS의 업계 선도적인 ML 역량은 우리가 혁신적인 솔루션을 빠르게 개발하고 배포하는 데 큰 도움이 됐다"고 설명했다.

 

이어 "우리의 비전은 크리에이티브 영역이 새로운 차원의 효율성을 확보하고 기업이 이미지 검색 등의 반복적인 업무 대신 창작에 집중할 수 있도록 돕는 것"이라고 말했다.

 

LG AI연구원의 엑사원 이미지투텍스트 변환 솔루션은 AWS 마켓플레이스와 아마존 세이지메이커 점프스타트를 통해 수백만 명의 전 세계 AWS 활성 고객이 사용할 수 있게 됐다. AWS 마켓플레이스는 독립 소프트웨어 공급업체(ISV)들이 제공하는 수천 개의 소프트웨어가 등록된 디지털 카탈로그이며, 아마존 세이지메이커 점프스타트는 개별 사용 사례에 맞게 사전 학습 모델에 대한 액세스를 제공하는 ML 허브다. 

 

또한 LG AI연구원은 엑사원을 아마존 베드록으로 마이그레이션할 계획이다. 아마존 베드록은 API를 통해 여러 FM을 사용할 수 있는 완전 관리형 서비스로 이를 통해 고객이 특정한 사용 사례에 가장 적합한 모델을 테스트·커스터마이즈·배포할 수 있도록 더 많은 선택권을 제공한다.

 

헬로티 이창현 기자 |









배너










주요파트너/추천기업