일반뉴스 업스테이지, LLM으로 처리하는 차세대 OCR 모델 발표
복잡한 형태의 문서에서도 각 구조와 텍스트 정보 정확히 분석해 업스테이지가 가장 정확하고 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리가 가능한 차세대 OCR 모델 'Document Parse'를 공개했다. Document Parse는 기존 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서에서도 각 구조와 텍스트 정보를 정확히 분석해 데이터 자산화를 가능하게 한다. 어떤 형식의 문서도 HTML과 같은 구조화된 텍스트 형식으로 전환해 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다. 업스테이지는 Document Parse를 통해 RAG 시스템 성능과 LLM의 응답 정확도를 결정하는 핵심 요소인 데이터 전처리 과정에서의 정확성뿐 아니라 속도와 사용성 측면에서도 현재 가장 진보한 형태의 문서 처리 기술을 선보이게 됐다. 업스테이지는 관련 기술의 성능 측정에 통용될 수 있는 객관적 기준 마련을 위해 문서 구조 분석 벤치마크인 'DP-Bench'를 함께 공개했다. 결과에 따르면, Document Parse는 레이아웃 및 테이블 구조, 콘텐츠 분석 등 정확성을 측정하는 모든 지표에서 AWS와 MS