네이버클라우드, 비정형 문서용 OCR 서비스 출시


영수증·신용카드·명함 등 비정형 문서 인식률 ↑

[아이뉴스24 최은정 기자] 네이버클라우드(대표 박원기)가 인공지능(AI) 기술을 기반으로 한 비정형 업무 문서용 광학문자인식(OCR) 서비스를 출시했다.

네이버클라우드는 비정형 업무 문서에서 사용자가 원하는 정보를 추출하는 '클로바(CLOVA) 도큐먼트 OCR' 특화 서비스를 11일 공개했다.

이번 서비스는 클로바 AI 자연어처리기술(NLP)로 비정형 문서들을 선행 학습시킨 후 글자 위치, 문서 양식과 관계없이 업무 문서에서 상호, 지점명, 사업자 번호와 같은 주요 정보만 추출한다. 항목별 분류까지 자동으로 진행할 수 있다.

도큐먼트 OCR 기술을 통해 신분증의 텍스트를 추출한 모습. [사진=네이버클라우드]

회사 측에 따르면 영수증, 의료비 영수증, 사업등록증의 경우 기관 마다 발급 형태가 달라 사용자가 희망하는 정보를 자동 추출하는 것이 쉽지 않았다. 또 주민등록증, 운전면허증, 여권과 같은 신분증은 빛 반사가 많고 워터마크나 형광인쇄 등의 위·변조 방지 기술이 적용돼 있어 OCR 적용이 어려웠다.

이번 서비스는 인식된 문서에서 정보의 연결 관계를 파악할 수 있어 텍스트와 숫자 값이 의미하는 바를 찾아낸다. 이와 함께 문자 이미지를 단순히 텍스트로 인식하는 것뿐 아니라 구겨지거나 오염된 각종 서류에서 추출된 텍스트를 항목별로 자동 기입할 수도 있다는 설명이다.

아울러 회사는 개인정보를 OCR로 인식할 경우 보안이 요구된다는 점을 감안해 사전 신청 절차로 승인을 받은 기업에서만 이번 서비스를 선별적으로 사용하도록 했다. 추후 안전한 사용을 위한 보안 아키텍처를 별도로 안내할 계획이다.

한상영 네이버클라우드 상무는 "다양한 산업군에서 자동화를 통해 업무를 간소화하는 추세가 이어지면서 OCR은 활용 분야가 다각화되고 핵심 기술로 자리매김하고 있다"며 "네이버 클라우드 플랫폼의 다른 서비스와 유기적으로 연계한 솔루션을 출시, 차별화된 서비스로 혁신을 선도해 나갈 것"이라고 말했다.

/최은정 기자(ejc@inews24.com)







포토뉴스