RAG 기술 성능 측정해 순위를 매겨, 기업에 적합한 솔루션을 비교 도입하도록 지원 올거나이즈가 RAG 리더보드인 '알리(Alli) RAG 리더보드'를 공개한다고 29일 밝혔다. RAG(Retrieval Augmented Generation, 검색증강생성)란 생성형 AI의 환각 현상을 최소화하는 대안으로 주목받는 기술이다. 사전 학습한 데이터만을 활용하는 게 아닌, 기업 내부 데이터 등 이미 존재하는 데이터에서 답을 찾아낸다. 이들 답변 중 질문 및 검색어의 맥락을 고려한 후 가장 적절한 대답을 제공하는 식이다. 올거나이즈의 RAG 리더보드는 RAG 기술의 성능을 측정해 순위를 매겨, 기업 AI 실무자가 가장 적절한 솔루션을 비교 도입할 수 있도록 돕는다. 올거나이즈의 알리 RAG 리더보드는 금융, 공공, 의료, 법률, 커머스의 5개 분야에 대한 한국어 RAG 성능을 평가한다. 답변 유사도 및 정확도를 판단하는 5개의 평가 툴로 RAG 성능을 평가해 신뢰도를 높이고 오차를 줄였다. 우선 각 분야별로 2~300페이지의 문서를 업로드한 후, 분야마다 사용자가 할 법한 질문 60개를 생성했다. 질문별로 RAG가 답변을 생성하면, 5개의 평가 툴 중 3개 이상에서
PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷으로 변환 가능 한글과컴퓨터(이하 한컴)가 PDF 문서에서 AI 데이터를 추출하는 소프트웨어 개발 키트(SDK) ‘한컴 데이터 로더’를 출시하고 본격적인 글로벌 B2B 세일즈에 나선다. 최근 세계 AI 업계에서는 LLM(대규모 언어모델)의 단점인 ‘환각 현상’을 최소화하는 해결책으로 ‘검색 증강 생성(RAG)’ 기술이 떠오르고 있다. RAG는 특정 데이터베이스나 문서 집합으로부터 관련 정보를 검색한 뒤 그 정보를 LLM에 적용해 적절한 답변으로 텍스트를 생성하므로 실시간으로 정보가 업데이트되며 정보의 정확도가 높은 것이 특징이다. 그 때문에 많은 글로벌 기업과 기관이 RAG의 도입을 원하지만, 구조화되지 않은 문서에서는 데이터 추출이 어려운 실정이다. 따라서 기업의 방대한 문서를 AI가 학습하기 좋은 형태로 데이터화하는 전처리 기술이 중요해졌다. 한컴은 지난 35년간 축적한 문서 기술을 바탕으로 문서의 AI 데이터화를 위한 전처리 기술을 모듈화해 ‘한컴 데이터 로더’라는 SDK 제품을 내놓았다. 대표적인 전자문서 형식인 PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷(JSON·CSV·TXT·
LLM 도입 시 고려해야 할, 환각, 보안, 비용 문제에 대해 진단 포티투마루가 22일인 오늘 TRAIN 심포지엄에서 품질 기반의 AI 신뢰성을 강조하며 ‘Trustworthy LLM : How to’를 주제로 세션을 진행한다고 밝혔다. TRAIN 심포지엄은 TRAIN 글로벌이 주최하고 부산IT융합부품연구소(CIDI), 전주정보문화산업진흥원(JICA), 한국산업기술시험원(KTL) 등이 후원하는 글로벌 행사다. 베트남, 태국, 인도네시아 등 동남아 각국과 AI 신뢰성 확보와 강화 움직임을 공유하는 것은 물론 이에 대한 글로벌 대응 방안을 공동 모색하는 자리가 될 예정이다. 행사에는 국내외 정부·공공기관과 AI 관련 기업·협회·단체를 비롯해 법조계와 학계 관계자들이 참석했다. 첫날 심포지엄에서는 ‘신뢰할 수 있는 AI를 위한 아시아 연대-정보 교류의 힘’을 주제로 기술과 교육, 법·제도·정책 세 개 세션에서 주제 발표가 진행되고, 저녁에는 행사 주요 인사가 모이는 비공개 교류의 장이 마련되며, 다음 날에는 TRAIN 총회가 진행될 예정이다. 포티투마루 해외사업 총괄 박주식 이사는 기술 세션에서 ‘Trustworthy LLM : How to’를 주제로 대규모 언어
생성형 인공지능(AI)을 업무에 도입한 일본 기업 비율이 5곳 중 1곳꼴인 18.0%에 불과하다는 일본 민간 연구소 조사 결과가 나왔다고 교도통신이 10일 보도했다. 보도에 따르면 노무라종합연구소 자회사인 NRI 시큐어 테크놀로지스는 지난해 8∼9월 일본과 미국, 호주 기업 2783곳을 대상으로 진행한 조사를 통해 이 같은 결과를 얻었다. 이 조사에서 생성형 AI를 활용한다고 답한 미국 기업은 73.5%이었고, 호주 기업도 66.2%에 달해 일본과 큰 차이를 보였다. 일본 기업은 직원 수가 적을수록 생성형 AI 도입률이 낮은 것으로 나타났다. 직원 규모별로 보면 종업원 1만 명 이상은 50.0%, 1000명∼9999명 기업은 21.5%, 1000명 미만은 15.7%였다. 일본 기업이 생성형 AI를 도입하는 데 검토해야 할 과제를 꼽아 달라는 질문에는 '결과가 불안정하다'를 택한 기업이 37.7%로 가장 많았다. 일본 정부와 기업들은 일본어 대응 능력이 있는 분야별 생성형 AI 개발을 추진하고 있다. 총무성 산하 국립연구개발법인인 정보통신연구기구(NICT)는 일본어 생성형 AI 모델을 개발 중이고, 통신업체 NTT와 소프트뱅크 등도 독자적으로 생성형 AI를 만
AI 활용에서 비롯될 사이버 보안 피해 강조 아크로니스가 29일인 오늘 2024년 보안 위협 전망을 발표했다. 칸디드 뷔스트(Candid Wuest) 아크로니스 사이버 보호 리서치 부사장은 먼저 AI가 계속 진화하며, 사이버 범죄자 역시 창의적으로 진화하고 있음을 시사했다. 지난 한 해 동안 AI가 크게 부상하면서 보안 위험도 그에 못지않게 증가했다. 제너레이티브 AI를 통한 딥페이크 생성에 관한 FBI 보고도 급증한 것으로 알려졌다. 사이버 범죄자는 공공의 위기, 가족 강탈, 심각한 주식 혼란 등 잘못된 정보를 통해 심각한 결과를 초래할 의도로 딥페이크 기술을 악용하고 있다. 특히 금전적 인센티브가 있는 경우, 기술에 대한 이해도가 높아짐에 따라 이런 일이 자주 발생할 가능성이 높다. 칸디드 뷔스트 부사장은 "일부 사이버 범죄자들은 민감한 정보를 빼내기 위해 창의적인 방법으로 AI를 사용하기 시작할 수도 있다. 피싱은 제너레이티브 AI의 맏아들이 되었으며, 이러한 위험은 개입 없이도 여전히 위협적일 것으로 예상된다. 2024년에는 AI를 둘러싼 새로운 규제가 대거 등장할 것으로 예상된다"고 말했다. 칸디드 뷔스트 부사장은 멀티팩터 인증(MFA) 변화에 대해
함샤우트 글로벌이 '함샤우트 글로벌 AI 툴 활용 경진대회'를 성황리에 마무리 했다고 밝혔다. 이번 경진대회는 인공지능과 함께 업무의 생산성, 혁신성, 창의성을 높일 수 있는 아이디어를 발굴하고 디지털 딥택트 시대를 열어가기 위한 함샤우트 글로벌만의 AI 활용 방안을 마련하기 위해 진행됐다. 지난 4월부터 약 4개월간의 모집 기간을 거쳐 진행된 경진대회에는 90여 명의 직원이 22개 팀을 이뤄 참여했다. 참가 팀들은 ▲AI를 활용한 브랜드 리서치 및 인사이트 발굴 ▲브랜드 대상 프로젝트 매니징 솔루션 ▲AI를 활용한 기획서 및 제안서 작성 ▲AI를 활용한 이벤트 당첨자 선정 등의 데이터 관리 ▲AI를 활용한 기자 및 인플루언서 발굴 및 관리 ▲AI를 활용한 저부가가치 업무 자동화 등을 주제로 다양한 아이디어와 솔루션을 제시했다. 특히 생성형 AI와 협업툴, 플랫폼, 플러그인 등을 폭넓게 경험하고 분석해 개인의 업무생산성을 높이고, 기업의 경쟁력 향상에 도움이 되는 솔루션을 제시해 눈길을 끌었다. 사전 심사를 거쳐 총 14개 팀이 최종 결선에 올라 프레젠테이션을 진행했으며 임직원으로 구성된 심사위원은 기획력, 활용성, 확장성 등을 기준으로 총 7팀을 선정해 수