다양한 오픈소스 및 상용 모델 선택 가능 및 용도에 따라 변형해 IBM은 기업이 고품질, 고성능의 다양한 파운데이션 모델을 폭넓게 이용하고, 자사의 필요에 따라 맞춤형으로 배포하도록 하기 위한 노력의 일환으로 왓슨x에서 미스트랄 라지(Mistral Large) 모델을 제공한다고 발표했다. 인공지능(AI) 개발자를 위한 IBM의 기업용 AI 스튜디오인 왓슨x는 IBM의 그래니트(Granite) 모델 외에도 다양한 오픈소스 및 상용 모델 선택이 가능하며, 이를 용도에 따라 변형하거나 비즈니스 솔루션 및 애플리케이션과 통합해 사용할 수 있다. IBM은 이미 왓슨x 내에서 기업 환경에 적용할 수 있는 소규모 모델인 Mixtral-8x7B를 제공하고 있다. 이 모델은 IBM이 최적화한 모델로, 주어진 시간 동안 처리할 수 있는 데이터의 양이 기존 모델보다 50% 증가했다. 이번에 새롭게 추가된 미스트랄 라지는 서비스형 소프트웨어(SaaS)로 먼저 제공된다. 이제 왓슨x 고객은 추론과 다국어 기능이 필요한 복잡한 전사적 작업을 처리하도록 최적화한 미스트랄 AI의 가장 강력한 모델을 활용할 수 있다. 검색증강생성(RAG) 전문화를 통해 더 장시간의 채팅 상호작용과 대용량
인텔은 국제 올림픽 위원회(IOC)와의 생성형 AI 검색 증강 생성(RAG) 솔루션 관련한 협력 내용을 발표했다. 이번 발표는 인텔 가우디 AI 가속기와 인텔 제온 프로세서를 활용한 개방형 AI 시스템 및 플랫폼으로 개발자와 기업이 당면한 과제를 어떻게 효과적으로 해결할 수 있는지에 대한 방법을 제시하고 있다. 인텔 데이터 센터 및 AI(DCAI) 그룹 총괄인 저스틴 호타드(Justin Hotard) 수석 부사장은 “IOC와의 파트너십을 통해 인텔이 AI 접근성을 높이기 위해 어떤 노력을 하는지 확인할 수 있다”며 “인텔은 혁신과 창의성을 장려하며, 가시적인 결과를 끌어내는 맞춤형 AI 솔루션을 구축할 수 있도록 개방된 경쟁의 장을 조성하고 있다. 인텔은 개방형 협력 생태계를 수용함으로써, 선수들을 지원하는 방법을 혁신하고 고객과 함께 새로운 가능성을 열어가고 있다”고 말했다. 올림픽 기간 동안 다양한 언어와 문화를 가진 약 1만1000명의 선수가 경기장을 탐색하고 규칙과 지침을 준수할 수 있도록 지원하기 위해 IOC는 인텔과 협력해 ‘애슬리트365’ 챗봇을 공동 개발했다. 해당 챗봇은 인텔 가우디 가속기와 제온 프로세서로 구동되는 RAG 솔루션으로, 선수의
RAG 솔루션, 벨라 큐나 통합으로 인한 검색 능력 극대화로 신뢰성 확보 인공지능(AI)이 전 산업 영역에 걸쳐 도입되며 혁신을 가속화하는 가운데, 단순 질의응답을 넘어 과업을 수행하거나 이용자의 사용 패턴을 학습해 편의를 제공하는 ‘AI 에이전트’가 서비스 경쟁력 확보의 핵심으로 부상하고 있다. AI 에이전트는 인공지능이 문제 해결을 위한 의사결정을 자율적으로 판단하고 수행하는 기술로 개개인을 위한 최적화한 서비스 제공이 가능하다. 대기업부터 스타트업까지 고객 만족도를 높이고자 AI 기반 서비스 제공에 박차를 가하는 가운데, AI 역량 강화로 마치 개인 비서와 같은 맞춤형 서비스를 제공하며 학업 및 업무, 상담, 돌봄 등 다양한 영역에서 성장 동력을 확보하고 있는 기업들의 움직임이 주목된다. 스켈터랩스는 자체 개발한 AI 에이전트인 ‘벨라 에이전트'를 활용해 다양한 산업 분야의 인공지능 전환(AX)을 지원하며 업무 효율을 높이고 있다. 벨라 에이전트는 단순한 질의응답을 넘어 사용자가 목표를 제시하면 인공지능이 사용자가 필요로 하는 다양한 도구와 데이터를 자율적으로 판단하고 신속하게 활용해 과업을 수행하는 챗봇 형식의 솔루션이다. 벨라 에이전트는 LLM의 한
딥네츄럴은 6월 19일부터 21일까지 서울 삼성동 코엑스에서 열리는 '제 13회 스마트테크코리아 2024(STK 2024)'에 참가해 자사의 최신 랭노드 엔터프라이즈(LangNode Enterprise) 솔루션을 선보인다. 스마트테크코리아는 국내 최대 미래 기술 전문 전시회다. AI를 중심으로 상품, 서비스의 제조 생산부터 유통과 물류, 소비의 과정에 적용되는 빅데이터와 클라우드, 로봇, 메타버스 등 최첨단 기술과 솔루션을 집중 조명하며 국내외 많은 참관객과 바이어가 참석한다. 딥네츄럴은 비즈니스 환경에 최적화한 LLMOps 솔루션을 제공하는 AI 스타트업으로, 고품질 언어 데이터 구축부터 파인튜닝, 양자화를 통한 성능 최적화, 효율적인 어플리케이션 개발 및 운영까지, LLM 적용의 전 과정을 지원한다. 올해 2월 MWC 2024에서 처음 선보인 랭노드는 LLM RAG 기반 AI 에이전트를 노코드로 개발, 테스트, 배포하는 솔루션이다. 개발자와 기획자가 함께 협업하며 LLM 기반 에이전트를 제작하고 빠르게 비즈니스에 적용할 수 있어 LLM을 도입하려는 기업에는 필수적이라는 반응이다. 특히, 이번 전시에서 선보이는 랭노드 엔터프라이즈는 데이터 보안이 중요한 은
AI가 문제 해결 위한 의사결정을 자율적으로 판단하고 과업 수행 스켈터랩스가 자체 개발한 AI 에이전트인 ‘벨라 에이전트'를 활용해 교육 분야의 AI 전환(AX)을 돕는 서비스를 제공한다고 19일 밝혔다. 벨라 에이전트는 사용자가 목표를 제시하면 인공지능이 문제 해결을 위한 의사결정을 자율적으로 판단하고 과업을 수행하는 챗봇 형식의 시스템이다. 기업용 LLM 브랜드인 ‘벨라(BELLA)’의 운영 툴에 접목돼 있으며, AI 에이전트에 RAG(검색 증강 생성) 기술을 통합해 LLM의 한계로 꼽히는 최신성과 정확도를 높인 것이 특징이다. 교육 특화 AI 에이전트는 실제 교육 현장에서 학생과 교직원의 학업 및 행정 업무 편의를 돕기 위해 설계됐다. 교육기관은 안내하고자 하는 정보가 담긴 문서를 업로드하면 해당 데이터를 기반으로 질의응답 가능한 챗봇 서비스를 이용할 수 있으며, 과업 수행까지 가능하다. 신규 정보가 발생하거나 내용 변경이 필요할 경우 챗봇에 대한 추가 개발없이 관련 문서만 교체하면 돼 편리하고 비용 효율적이다. 문서 업로드 및 관리는 백오피스 도구와 API를 통해 제공된다. 교내 ERP 시스템과의 연동도 지원한다. 연동 시 다양한 정보 제공은 물론 간
AI 통합검색 솔루션 '코난 서치'와 문서생성 AI '코난 LLM' 소개할 예정 코난테크놀로지가 19일부터 21일까지 3일간 코엑스에서 개최되는 ‘인공지능&빅데이터쇼 2024’에 참가해 높은 수준의 검색 기술력을 선보이고, RAG 발표도 진행한다. 이번 행사에서 코난테크놀로지는 ‘검색과 생성의 완벽한 조화, RAG’을 주제로 AI 통합검색 솔루션 '코난 서치'와 문서생성 AI '코난 LLM'을 소개한다고 밝혔다. 코난 서치는 사용자가 입력한 검색어가 정확히 일치하지 않아도 검색 이면의 의도를 이해해 원하는 정보를 빠르고 정확하게 찾아준다. 코난테크놀로지는 코난 서치가 이미 2000여 고객사에서 성능을 검증 받았다고 밝혔다. 서울특별시 외 지방자치단체 100여 곳, 행정안전부 외 공공행정기관 500여 곳, 그리고 1400여 곳의 기업에서 코난 서치를 통해 업무 효율을 높이고 진화한 검색을 경험했다고 언급했다. 현재 온프레미스로 제공 중인 코난 서치는 연내 클라우드(SaaS) 버전 출시를 목표로 개발 중이다. 지난해 출시된 코난 LLM은 뛰어난 문서 생산성과 높은 보안성으로 기업과 기관의 생성 AI 수요에 부합한다. 특히 생성형 AI가 근거 있는 답변을
시놀로지(Synology)는 글로벌 고객 서비스를 혁신하기 위해 AI를 전체 프로세스에 통합해 지원 제공의 효율성과 품질을 향상 시킬 것 이라고 30일 밝혔다. 빈센트 차이 기술 서비스 책임자는 “시놀로지는 제품 사용 문의, 중요한 트러블 슈팅 및 복잡한 제품 도입에 대한 자문서비스를 포함하는 포괄적인 기술 지원을 제공한다”며 “새로운 AI 지원의 도입으로 기본적인 문의에 대한 응답 시간을 대폭 단축해 기술 지원 엔지니어가 즉각적인 주의가 필요한 복잡한 사례를 해결하는 데 집중할 수 있도록 하는 것이 목표”라고 말했다. 시놀로지는 검색-증강 생성(RAG, Retrieval-Augmented Generation) 아키텍처를 활용해 AI 지원은 익명화된 기술 자료, 또한 시놀로지에서 전 세계 수백만 고객에게 서비스를 제공한 경험을 통해 얻은 트러블 슈팅 데이터에 액세스할 수 있다. 추가 연계 및 강화 학습 프로세스를 수행하며 고품질의 유용한 응답 제공과 스스로 자동화 발전이 보장된다. 빈센트 차이는 “시놀로지의 1세대 AI 고객 서비스 지원의 도입으로 고객이 훨씬 빠르게 지원을 받을 수 있으며 최대 20배까지 개선된 보다 최적화된 서비스 경험을 제공받을 수 있다
RAG 기술 성능 측정해 순위를 매겨, 기업에 적합한 솔루션을 비교 도입하도록 지원 올거나이즈가 RAG 리더보드인 '알리(Alli) RAG 리더보드'를 공개한다고 29일 밝혔다. RAG(Retrieval Augmented Generation, 검색증강생성)란 생성형 AI의 환각 현상을 최소화하는 대안으로 주목받는 기술이다. 사전 학습한 데이터만을 활용하는 게 아닌, 기업 내부 데이터 등 이미 존재하는 데이터에서 답을 찾아낸다. 이들 답변 중 질문 및 검색어의 맥락을 고려한 후 가장 적절한 대답을 제공하는 식이다. 올거나이즈의 RAG 리더보드는 RAG 기술의 성능을 측정해 순위를 매겨, 기업 AI 실무자가 가장 적절한 솔루션을 비교 도입할 수 있도록 돕는다. 올거나이즈의 알리 RAG 리더보드는 금융, 공공, 의료, 법률, 커머스의 5개 분야에 대한 한국어 RAG 성능을 평가한다. 답변 유사도 및 정확도를 판단하는 5개의 평가 툴로 RAG 성능을 평가해 신뢰도를 높이고 오차를 줄였다. 우선 각 분야별로 2~300페이지의 문서를 업로드한 후, 분야마다 사용자가 할 법한 질문 60개를 생성했다. 질문별로 RAG가 답변을 생성하면, 5개의 평가 툴 중 3개 이상에서
엔비디아가 생성형 AI를 통해 HPC(고성능 컴퓨팅) 작업을 가속화하며 코드 생성, 기상, 유전학, 재료 과학 분야의 연구를 지원하고 있다고 16일 밝혔다. 생성형 AI는 국가와 기업 연구소에서 비즈니스와 과학을 위한 HPC을 가속화하며 기반을 다지고 있다. 샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 야심찬 시도를 하고 있다. 여러 국립 연구소의 연구진들이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있다. 샌디아 국립 연구소의 연구진들은 검색 증강 생성(retrieval-augmented generation, RAG)을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있다. 이들은 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여주고 있다. 과학자들이 평가하게 될 RAG 옵션 중에는 네모 리트리버(NeMo Retriever)와 같은 클라우드 기반 서비스도 있다. 로버트 훅스트라 샌디아 국립 연구소의 익스트림 스케일
포티투마루 RAG42 솔루션과 네이버 하이퍼클로바X 연계로 원스톱 서비스 제공 포티투마루가 네이버클라우드로부터 전략적 투자를 유치했다고 8일 밝혔다. 지난해 12월 ‘하이퍼클로바X’ 기반의 초거대 인공지능 사업 협력을 위해 업무 협약을 체결한데 이어 시리즈B 라운드에서 투자를 유치하며 HyperCLOVA X 기반의 파트너십 구축을 공고히 했다. 이번 투자는 네이버의 초대규모 AI ‘하이퍼클로바X를 기반으로 두 회사 간의 기술 협력을 강화하고 사업적 시너지를 극대화하기 위한 전략적 투자다. 양사는 포티투마루의 RAG42와 하이퍼클로바X와의 연계로 각 산업군별 도메인 특화 엔진 개발이 가능하도록 RAG 컨설팅부터 LLM 솔루션 구축까지 원스톱 서비스를 제공할 예정이다. 네이버클라우드는 포티투마루가 그동안 글로벌 생성형 AI 분야에서 보여준 뛰어난 기술력과 혁신성이 높게 평가됐고, 다년간 시장에서 검증받은 다양한 상용 사례가 투자 유치에 주요하게 작용했다고 전했다. 네이버클라우드 임태건 전무는 “포티투마루와의 사업적 제휴 협력에 이은 전략적 투자를 통해 하이퍼클로바X를 활용해 생성 AI 분야에서 실질적인 성과를 창출해 가고자 하는 양사의 공동 목표를 실현하고자 한
PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷으로 변환 가능 한글과컴퓨터(이하 한컴)가 PDF 문서에서 AI 데이터를 추출하는 소프트웨어 개발 키트(SDK) ‘한컴 데이터 로더’를 출시하고 본격적인 글로벌 B2B 세일즈에 나선다. 최근 세계 AI 업계에서는 LLM(대규모 언어모델)의 단점인 ‘환각 현상’을 최소화하는 해결책으로 ‘검색 증강 생성(RAG)’ 기술이 떠오르고 있다. RAG는 특정 데이터베이스나 문서 집합으로부터 관련 정보를 검색한 뒤 그 정보를 LLM에 적용해 적절한 답변으로 텍스트를 생성하므로 실시간으로 정보가 업데이트되며 정보의 정확도가 높은 것이 특징이다. 그 때문에 많은 글로벌 기업과 기관이 RAG의 도입을 원하지만, 구조화되지 않은 문서에서는 데이터 추출이 어려운 실정이다. 따라서 기업의 방대한 문서를 AI가 학습하기 좋은 형태로 데이터화하는 전처리 기술이 중요해졌다. 한컴은 지난 35년간 축적한 문서 기술을 바탕으로 문서의 AI 데이터화를 위한 전처리 기술을 모듈화해 ‘한컴 데이터 로더’라는 SDK 제품을 내놓았다. 대표적인 전자문서 형식인 PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷(JSON·CSV·TXT·
문의 65%가 문서 AI 기술 관련 내용..전년 대비 2배 이상 증가 이파피루스가 AI 특화 문서 데이터 추출 기술을 앞세워 시장 확대를 위한 전략을 밝혔다. 이파피루스는 올해 1분기 글로벌 고객 문의 중 65%가 문서 AI 기술에 관련된 내용으로, 전년 동기 대비 2배 이상 증가했다고 발표했다. 특히 지난 연말 오픈AI의 ‘챗GPT’에 학습 및 문서 처리 서비스를 위한 PDF 기술을 공급하면서 오픈AI의 기업 고객까지 해당 기술을 사용하게 되는 등 AI 업계에서의 영향력을 한층 강화했다. 이파피루스 김정희 대표는 “텍스트 데이터를 AI가 이해하는 형태로 추출하는 기술은 대규모언어모델(LLM)이나 RAG(Retrieval Augmented Generation)와 같은 자연어 처리 모델의 훈련 및 활용에 필수적”이라며 “과거엔 텍스트 추출 기술이 소수의 LLM 훈련 기업에만 수요가 있었다면 최근엔 LLM을 직접 활용하고자 하는 일반 기업까지 시장이 크게 확대됐다. 이에 LLM 학습을 위한 텍스트 추출 기술 수요도 함께 증가했다”고 전했다. LLM에 대한 수요 증가는 LLM과 RAG의 결합으로 이뤄졌다. LLM을 활용한 AI 솔루션은 그럴듯한 오류나 거짓말을 결
에이프리카 김동규 부대표 인터뷰 생성형 AI는 마치 신대륙과 같다. 기업은 새롭게 등장한 기술을 향해 거침없이 뛰어들고 있다. 그 중에서 주목받는 분야는 거대언어모델(LLM)이다. 기업은 LLM을 적용함으로써 운영 효율성과 생산성을 극대화하는데 초점을 맞췄다. 물론 이 같은 기술 도입을 현실화하기 위한 선결 과제와 어려움은 여전히 존재한다. 이를 고려해 에이프리카는 안전하고 전문성을 갖춘 LLM을 선보였다. 에이프리카는 AI라는 넓은 초원에서 경쟁력이라는 우물을 만들고 있다. AI로 가는 지름길 제공하다 오늘날 기업은 AI를 주목한다. 챗GPT로부터 촉발한 생성형 AI의 성장이 비즈니스에 큰 변화를 가져올 것이 분명하기 때문이다. 특히 LLM은 기업 운영에 효율성을 더해줄 열쇠로 손꼽힌다. 이와 동시에 LLM과 같은 AI 모델 도입에는 여러 과제가 수반된다. 기업은 고품질 데이터 확보를 비롯해 데이터 프라이버시, 사이버 보안, AI 윤리 등의 고민거리를 해결해야 한다. 에이프리카는 AI 기술과 클라우드 네이티브 서비스를 운영관리하는 소프트웨어를 개발하는 회사로, 언어 모델과 컨테이너 관리, 개발 및 배포를 위한 플랫폼을 제공하며, 기업이 혁신적인 AI 서비스
총 매출 성장률 315.1%, 연평균 성장률 60.7% 기록해 포티투마루가 영국 파이낸셜 타임즈(FT)가 발표한 ‘2024 아시아-태평양 고성장 기업(FT High-Growth Companies Asia-Pacific)’에 3년 연속 선정됐다고 20일 밝혔다. 영국의 경제 일간지 파이낸셜 타임즈와 독일 글로벌 리서치 전문기관인 스태티스타는 아시아-태평양 지역 13개 국가의 1만5000여 개 기업 중 높은 성장세를 보인 500대 기업을 선정해 매년 발표한다. 이번 순위는 2019년 매출 10만 달러 이상, 2022년 매출 100만 달러 이상인 기업을 대상으로 2019년부터 2022년까지 혁신성과 연평균 성장률(CAGR)을 기준으로 평가가 이뤄졌다. 포티투마루는 총 매출 성장률 315.1%, 연평균 성장률 60.7%를 기록해 생성형 AI 기업으로는 2022, 2023년에 이어 2024년에도 3년 연속 1위로 선정됐다. 포티투마루는 생성형 AI 스타트업으로 초거대 언어모델의 단점인 환각 현상을 검색증강생성 기술인 'RAG42'와 AI 독해 기술인 'MRC42'와의 엔지니어링으로 완화하고, 기업용 프라이빗 모드를 지원해 기업 내부 데이터와 민감한 고객 정보 유출에
국내외 AI 관련 산업의 정보 교류, 교육 및 기술 자문, 해외 마케팅 협력 등에서 협력 베슬에이아이코리아는 지난 12월 21일 사이오닉에이아이와 AI 분야의 협력 강화 및 공동 발전을 목표로 하는 MOU를 체결했다고 26일 밝혔다. 본 협약은 양사 간의 유기적인 AI 기술 협력 네트워크 구축을 목표로 하며, 인적, 물적 자원 및 정보의 교류를 통해 양사의 경쟁력 강화와 공동 발전을 도모하기 위해 체결됐다. 특히, 국내외 AI 관련 산업의 정보 교류, 교육 및 기술 자문, 일본과 미국에서의 마케팅 협력, RAG(Fine-tuning)에 대한 협업 등 다양한 분야에서의 협력이 포함돼 있다. 안재만 베슬에이아이 대표는 “이번 협약으로 인공지능 분야에서의 기술 협력이 한층 강화될 것이라며, 특히 RAG와 Fine-tuning 분야에서의 협업을 통해 양사는 서로의 기술력을 보완하고 시너지를 낼 수 있을 것”이라고 말했다. 이어서 그는 “베슬에이아이코리아는 이번 파트너십을 통해 더욱 강화된 글로벌 시장 진출 전략을 수립하고 실행에 옮길 수 있게 되었다”고 덧붙였다. 사이오닉AI의 고석현 CEO는 “AI 기술은 4차산업 혁명의 핵심이며, 이번 협약은 양사의 기술력을 통