[인팩] 박민우 크라우드웍스 "AI 경쟁력 결국 사람…HR플랫폼 목표"


"회사의 미래 경쟁사는 크몽, 숨고와 같은 프리랜서 플랫폼"

[아이뉴스24 박진영 기자] "인공지능에게 데이터란 위키백과와 같다. 데이터는 AI가 필요한 답을 찾아주기 위한 교과서와 같은 것이다. 디지털 뉴딜의 핵심인 데이터는 그 무엇보다 품질이 중요한데, 품질은 데이터를 가공하는 데이터 라벨러의 역량에 의해 좌우될 수 있다"

박민우 크라우드웍스 대표 [사진=크라우드웍스]

정부 디지털뉴딜 주요 수행과제인 데이터댐 구축은 '데이터라벨링'이 핵심이다. 4천억 규모의 데이터댐 사업 예산에서 1천800억원(60%) 이상이 관련 사업에 투자된다. 인공지능(AI) 기술 고도화를 위해서는 학습데이터 품질을 높여야 하는데, 그 작업의 핵심이 각각의 데이터 요소를 분류·가공하는 것이다.

지난 2017년 창립한 크라우드웍스는 AI 데이터라벨링 분야 대표 기업으로 자리매김했다. 회사 창립 4년만에 폭풍 성장하면서 AI데이터 기업으로는 최초로 내년 상장을 준비 중이다. 지난 9일 서울 강남구에 위치한 크라우드웍스 본사에서 박민우 대표와 만나 회사의 성장 스토리를 들어보았다.

박민우 대표가 회사를 창업했을 당시, 국내에서는 '이세돌 vs 알파고' 바둑 대결로 AI에 대한 대중의 관심이 높아졌고, 이에 따라 정부의 지원도 집중되고 있었다.

데이터 라벨링(전처리)이라는 이론 자체는 새로운 것이 아니다. 20년 전에도 이와 비슷한 개념은 있었지만, 개념을 구현할 수 있는 환경(인프라)이 이제야 마련된 것이다. 과거에는 데이터라벨링 업무를 AI개발 엔지니어들이 전담했다면, 기술이 발전하면서 생산성 효율을 높이기 위해 개발 과정의 세분화가 필요해졌다.

박 대표는 "AI 솔루션을 만들기 위해 데이터는 필수 요소다. 특히 인공지능 서비스 출시 과정에 들어가는 시간 중 70%가 데이터 수집·가공에 쓰이게 되기 때문에, 전처리 과정을 얼마나 효율적으로 줄이느냐가 서비스 론칭에 중요한 요소일 수밖에 없다"면서, "AI기업들은 솔루션을 고도화시킬 학습데이터를 수집하고 가공하기에는 시간과 인력 리소스가 부족하기 때문에 크라우드웍스와 같이 데이터 라벨링(전처리)만 전문적으로 하는 플랫폼에 대한 니즈가 증가할 것이라 확신했다"면서 창업의 배경을 설명했다.

그는 현재 국내 AI기술은 중학교 3학년 수준이라고 진단했다. 인공지능을 고등학생 수준으로 끌어올리기 위해서는 학습데이터 품질을 높이는 것이 핵심이라고 강조했다. 데이터 품질을 높이기 위해서는 데이터 자체에 손을 대거나 사람의 실수를 줄이게 하는 등 크게 2가지 방식이 있는데, 회사는 데이터보다는 사람 관점으로 접근하겠다고 전했다.

한 글로벌 보고서에 따르면, 2025년까지 매뉴얼 방식의 데이터 가공이 전체의 80% 가량을 차지하고 있다. 완전 자동화는 전체의 2%에 불과하고, 결국 그 오류를 찾아내는 것은 사람의 몫이다. 더욱이 AI기술을 고등학교 정규과정 이상의 수준으로 높이려면 가공 과정에서 고숙련된 작업이 필요하다는 설명이다.

박 대표는 "초등학교 수준의 AI 개발에는 데이터 가공 과정에서 완전 자동화가 가능하다. 그런데 사회에서 필요로 하는 AI기술은 고등학교 정규과정 이상의 수준이고, 이를 위해서는 고숙련된 지식을 가진 사람이 개입해야 한다"면서, "현재 의뢰 고객들의 AI모델 수준자체도 높아졌기에 데이터 가공 형태도 상당히 높은 수준"이라고 말했다.

고도로 발달한 인공지능이 인간의 일자리를 빼앗을 것이라는 우려가 나오고 있지만, 박 대표의 생각은 다르다. 그는 "인공지능은 사람이 하던 일을 대체하기 위해 만들어졌지만, 사람이 하는 일은 같은 자리에 고정되어 있는 것이 아니라, 새로 생기고 사라지기를 반복하며 시대에 맞춰 진화한다"면서, "새로운 영역에서 인공지능을 학습시킬 데이터를 가공하고 생산하기 위해 사람이 필요하다"고 덧붙였다.

회사는 국내 최대 규모인 25만명 데이터라벨러를 보유하고 있으며, 이를 기반으로 디지털 긱 이코노미에 최적화된 HR 플랫폼 '크라우드 잡스'를 오는 9월 정식으로 오픈할 계획이다. 이는 데이터 라벨링을 수행하며 축적된 전문성, 성실성, 숙련도 등 회원 개개인의 행동 데이터를 기반으로 플랫폼 노동력이 필요한 기업과 매칭시켜주는 서비스다.

박 대표는 "크라우드웍스의 가장 큰 경쟁력은 크라우드 소싱 방식으로 지금까지 쌓아온 데이터 라벨러들의 방대한 행동데이터"라면서, "데이터 라벨링은 진입장벽이 낮기 때문인데, 누구나 쉽게 창업이 가능하고, 빠르게 레드오션이 될 수 있는 분야다. 특히, 휴먼리소스 시장은 데이터량과 규모의 싸움인데, 크라우드웍스는 후발주자가 따라올 수 없는 압도적인 데이터량을 보유하고 있다"고 전했다.

아직 데이터 라벨러의 행동 패턴을 분석해 인력을 매칭해주는 HR테크는 존재하지 않는 상황. 회사는 방대한 행동데이터를 바탕으로 작업자들을 평가할 수 있는 평가 지표를 구축하고, 이를 통해 디지털 휴먼 리소스 플랫폼으로 거듭나겠다는 계획이다. 더 나아가 프리랜서가 전체의 60%를 차지하게 될 긱이코노미 시장에서 새로운 게임 체인저가 되겠다는 포부다.

박 대표는 "현재 국내에 크라우드웍스와 같이 데이터 라벨링 플랫폼 사업을 영위하는 기업은 수백곳이 넘기 때문에, 이들을 경쟁사라고 규정짓기 어렵다"면서, "데이터라벨링을 하나의 서비스로 보고, 사업을 HR플랫폼으로 확장시켜 나갈 것이다. 향후 국내 최대 데이터 기반 HR테크 플랫폼이 되면, 크몽이나 숨고와 같은 프리랜서 플랫폼들이 저희 회사의 경쟁사가 될 것"이라고 밝혔다.

회사의 지난해 매출은 70억원이었으며, 올해 목표 매출액은 150억이다. 현재 한국투자증권을 주관사로 선정해 내년 초 기술평가를 받은 후, 내년 2~4분기 내에 코스닥 상장을 준비하고 있다. 이밖에 데이터 라벨러 역량 교육 서비스인 '크라우드웍스 아카데미'를 도입해 현재까지 2만7천명이 교육을 수료했다. 또 고용노동부와 연계해 데이터라벨러를 위한 체계적인 직무교육을 신설하고, 내일배움카드를 통해 관련 교육을 지원할 계획이다.

/박진영 기자(sunlight@inews24.com)







포토뉴스