[아이뉴스24 최은정 기자] 솔트룩스는 우리말 자원 보호를 위해 국립국어원의 '구어 자료 수집·원시 말뭉치 구축 사업'을 수주했다고 12일 발표했다.
해당 사업은 국립국어원이 TV·라디오 등 구어 원자료와 드라마·연극대본 등 준구어 원자료를 수집해 말뭉치를 구축하고, 이를 민간에서 활용하기 위해 실시하는 사업이다. 말뭉치는 언어 연구를 위해 PC가 텍스트를 가공·처리·분석할 수 있는 형태로 모아 놓은 자료를 말한다.
이번 사업에서 솔트룩스는 자체 인공지능(AI) 기술을 활용해 말뭉치를 확보하는 역할을 한다. 이를 통해 우리말 데이터를 확보하고, 품질을 높인다는 방침이다.
앞서 솔트룩스는 지난해 자체 말뭉치 구축 전문 인력을 통해 국립국어원 '국어 말뭉치 연구·구축 사업'을 수행한 바 있다. 그 외에도 한국전자통신연구원(ETRI) ‘음성 데이터베이스(DB) 구축', 한국언론진흥재단 '뉴스 빅데이터 시스템 구축' 등을 진행했다.
이경일 솔트룩스 대표는 "AI 산업 및 국어·언어학계에 필요한 구어 말뭉치 구축을 위해 유용성 검증과 품질 확보라는 두 마리 토끼를 잡아야 한다"며 "자체 보유한 AI 원천 기술력과 국내 최다 AI 서비스 개발 경험을 통해 성공적으로 사업을 수행할 것"이라고 말했다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기