로민, “AI 기술 통해 필기체 문서 인식 성능 개선”

2021.12.20 09:34:22

주혜선 기자 sun1460@hellot.net

인공지능 문서인식(AI OCR) 솔루션 전문기업인 로민(대표 강지홍)이 국가기록원의 ‘2021년 국가기록관리·활용기술 연구개발 사업’의 일환인 ‘기록물 OCR 데이터셋 구축 및 한글 필기체 인식 성능 개선 연구’ 과제 수행을 통해, 필기체 OCR의 성능을 향상시켰다고 20일 밝혔다. 


업체 개발 관계자는 “이번 사업에서 자체 개발한 인공지능 문자인식 모델에 국가기록원이 선별 제공한 기록물의 필기체 문서 이미지를 분석해 필기체 기록물 데이터셋을 구축하고, 필기체 OCR 알고리즘을 개발해 필기체 기록물 특성에 최적화된 모델을 구현했다”고 설명했다. 

 


그는 “로민의 필기체 OCR 모델은 노이즈가 많은 오래된 한글 필기체 기록물 샘플에 대해 필기체 검출 성능 98.38%, 필기체 인식 성능은 단어단위 89.82%, 음절단위 95.86%에 달해 목표치를 초과하는 성능을 보였다”며 “한국정보통신기술협회(TTA)의 소프트웨어시험인증연구소의 시험 및 검증 결과에 따르면, 필기체 검출의 경우는 당초 설정한 목표치 대비 10% 이상 높은 성능을 보였다”고 덧붙였다.

 


이 기술은 문서 1장 당 인식속도가 평균0.77초로, 5천 장의 문서를 직접 사람이 타이핑해 변환 시 540여 시간 소요되는 업무를 1.1시간만에 처리할 수 있게 지원한다. 2명의 작업자가 매일 5시간 업무 시, 약 2개월이 소요되는 업무를 한 시간 만에 처리할 수 있게 되는 셈이다.


로민 강지홍 대표는 “로민의 AI OCR 기술이 국민들의 비전자기록물 접근성 향상에 기여할 수 있을 것”이라며 “그간 확보된 인식 성능을 바탕으로 공공분야와 다양한 산업분야의 인공지능 문자인식 기술 적용에 주력하겠다”고 말했다.


한편, 로민은 지난해 국가기록원의 ‘한글 타자기록 문자인식 기술 개발’에도 참여, 98.3% 인식률을 확보한 바 있다.

Copyright ⓒ 첨단 & Hellot.net






검색