[아이뉴스24 윤지혜 기자] 정부의 '디지털 뉴딜' 정책에 발맞춰 국내 데이터 산업이 각광받고 있지만, 여전히 관련 제도와 인식이 부족하다는 지적이 나왔다.
31일 이정수 플리토 대표는 한국인터넷기업협회가 주최한 '데이터가 만드는 산업 데이터로 만드는 것들' 간담회에서 "인공지능(AI) 학습을 위한 데이터가 많이 부족하다"며 "의료·법률·특허·무역 등 특수한 환경에서 쓰이는 특수 데이터는 더 없는 상황"이라고 말했다.
AI 산업의 기초 재료인 데이터 자체가 부족하다 보니, 저작권을 고려하지 않고 데이터를 무차별 수집하는 사례도 발생하고 있다.
이 대표는 "데이터 저작권에 대한 개념이 없는 업체들이 많다"며 "예컨대 전문번역업체가 자신들의 번역물을 코퍼스(말뭉치)로 팔기도 하는데, 사실 이 데이터에 대한 저작권은 번역을 의뢰한 사람들이 가지고 있다"고 꼬집었다.
이어 "소셜네트워크서비스(SNS)나 웹상의 데이터를 코퍼스로 활용하는 경우도 많은데, 사실 공공데이터가 아니면 사용하면 안 된다"며 "유럽과 달리 국내에는 이를 제재할 만한 법적 근거가 미약하다"고 덧붙였다.
이에 정부는 디지털 뉴딜 사업의 일환으로 대규모 AI 학습용 데이터 구축 사업에 나섰다. 최근 과학기술정보통신부가 AI 학습용 데이터 구축에 책정한 예산만 3천억원에 달한다. 이 밖에도 정부는 제주 등 국내 5개 지역의 방언 데이터를 모으는 데도 100억원 가까운 예산을 배정한 상태다.
데이터 산업이 갑작스럽게 주목받으면서 시장 혼란도 발생하고 있지만, 국내 데이터 산업 활성화를 위해선 거쳐야 할 진통이라는 진단도 있다.
김태훈 디핑소스 대표는 "정부에서 많은 자금을 투입하다 보니 기존에 데이터와 무관했던 회사도 업종을 전환할 정도로 업계가 혼란스러운 것은 사실"이라며 "다만 2~3년간 이 같은 정책이 이어진다면 양질의 데이터가 많이 생길 것으로 기대한다"고 말했다.
류재준 네이버비즈니스플랫폼 이사는 "한국정보화진흥원이 'AI 허브'를 만들었을 때도 어떤 데이터를 모아야 할지, 이걸로 어떤 사업을 할 수 있을지 업계 혼란이 있었지만, 1년간 데이터가 쌓이면서 관련 서비스도 만들어지고 있다"고 말했다.
이어 "데이터를 다룰 수 있는 사람이 생각보다 적고, 지방으로 갈수록 더 주는 추세"라며 "쌓인 데이터로 경진대회를 여는 등 학생들이 데이터를 직접 다룰 수 있는 환경이 마련되면 장기적으로 데이터 산업 발전에 도움이 될 것"이라고 조언했다.
윤지혜 기자 jie@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기