[서울창업허브 우수기업 ②] 박민우 크라우드웍스 대표 “서울창업허브와 함께 베트남 진출 ‘코앞’”

서울창업허브 특집 | 우수기업 ② 크라우드웍스


[한경잡앤조이=이도희 기자] 최근 인공지능(AI)의 붐을 본격화 한 데 일조한 게 바로 딥러닝(Deep Learning)이다. 소프트웨어를 수정하기 위해 과거 전통적인 머신러닝 기술로는 소스코드 전체를 바꿔야했다면, 딥러닝은 간단한 데이터 조작만으로 수정이 가능하도록 만들었다. 관건은 AI가 이 데이터를 얼마나 정확히 인식할 수 있느냐는 것.
정확도를 높이기 위해서는 AI에게 다양한 데이터를 학습시켜야 한다. 예를 들어, AI는 일부만 있거나 다른 물체와 함께 있는 버스 그림은 구분하지 못한다. 누군가 방대한 양의 그림을 수집하고 이중 버스가 있는 곳을 표시해서 AI가 판별하도록 해야 한다. 이 작업을 ‘데이터 라벨링’이라고 부른다.
크라우드웍스는 이 라벨링 작업자 즉 ‘데이터 라벨러’를 위한 작업 플랫폼을 만들었다. 이곳에서 라벨링을 의뢰한 기업과 라벨러들이 모여 공동 작업이 가능하다. 크라우드웍스는 AI 기술 고도화에 필요한 데이터를 수집하고 가공해주는 국내 대표 AI 학습 데이터 플랫폼이다. 아마존의 ‘매카니컬 터크(Amazon Mechanical Turk)’를 벤치마킹했지만 매카니컬 터크보다 데이터의 퀄리티를 월등히 높였다는 게 박민우(50) 크라우드웍스 대표의 설명이다.


“아시아의 현재 수준으로는 미국의 기술을 따라잡기 불가능해요. 그래서 생각한 대안이 바로 데이터의 퀄리티를 높이는 것이었죠. 특정 분야의 순도 높은 데이터를 학습해 정확도를 높이기로 했습니다.”
데이터 처리 속도도 중요하다. 크라우드웍스는 현재 보유 중인 16만 명의 데이터 라벨러를 크라우드소싱해 대량의 데이터를 빠른 속도로 가공 및 수집한다. 불특정 다수가 참여하기 때문에 발생하는 퀄리티 문제는 100% 전수 검수로 해결해 데이터 품질을 99% 보증한다.
크라우드웍스는 2017년, 회사 창업 두 달 만에 네이버에서 2억 원의 투자 유치를 시작으로 1년 뒤 시리즈A 투자에 현재까지 누적 투자유치 금액은 120억 원에 달한다. 2017~2018년은 네이버를 비롯한 대기업들이 AI에 막대한 비용과 인력을 투입하던 시기였고, 데이터 가공에 특화된 스타트업이 주목받을 수밖에 없었다.
“사업 초기에는 AI 시장이 계속 성장할지 확신할 수 없었어요. 그런데 곧 대기업이 AI에 엄청난 투자를 하더라고요. 게다가 올해 코로나19로 재택근무에 대한 필요성도 커지면서 크라우드소싱이 더 주목받기 시작했습니다. 크라우드웍스의 플랫폼은 포스트코로나 시대에 특히 적합한 시스템이라 확신합니다.”


올 9월부터는 베트남 진출에도 본격 시동을 걸었다. 서울창업허브가 주관하는 ‘우수 스타트업 베트남 진출 프로그램’에 선정되면서다. 현재 코로나19로 현지 활동은 어렵지만 서울창업허브로부터 현지 전문 컨설팅 업체를 소개 받아 계속 시장조사와 네트워크 확보에 집중하고 있다. 이를 통해 베트남 현지 협력사를 확보하고 서비스 현지화에 필요한 전문 인력 육성과 기술 검증(PoC) 등을 단계별로 진행해 나갈 계획이다.
데이터 정확도를 99%까지 끌어올렸지만, 초기 작업자의 수준을 높여야 검수 부담이 줄어든다. 그래서 크라우드웍스는 최근 온라인 교육서비스인 ‘크라우드웍스 아카데미’도 열었다. 초급자를 위한 커리큘럼부터, 프로젝트 관리자를 위한 고급 강좌까지 다양한 프로그램을 오픈해 데이터 라벨러의 전문성과 직업의식을 강화해 나갈 예정이다.
“2022년까지 데이터 라벨러를 100만명 모집해 누구도 범접할 수 없는 AI학습데이터 수집 및 가공 플랫폼을 만들고자 합니다. 이들 작업자의 방대한 행동 데이터를 활용해 작업자 평가지표를 구축, 이를 통해 디지털 휴먼 리소스 플랫폼을 설계할 수도 있죠. 동시에 데이터 라벨링에 대한 사회적 인식도 개선하고 싶습니다. 크라우드웍스와 같이 시공간의 제약을 받지 않고, 비대면으로 할 수 있는 아르바이트는 계속 성장할 것입니다. 지금까지 데이터 라벨링은 단순히 ‘인형 눈알 붙이기’ 정도로 여겨졌지만 인공지능이 고도화되면서 특히 의료·법률·어학 등 분야에 적합하고 정교한 데이터의 중요성도 함께 높아지고 있습니다. 데이터 라벨링을 한국 AI 산업과 함께 성장할 수 있는 직업으로 인식시키기 위해 노력하겠습니다.”
법인 설립: 2017년 4월주요사업: AI 기술 고도화에 필요한 데이터를 수집하고 가공해주는 AI 학습 데이터 플랫폼성과: 직원 수 2명으로 시작해 최근 80명까지 성장, 데이터 라벨링 참여자(회원)와 데이터 수집 및 가공 수요 증가, 데이터 라벨러에게 지급되는 수익 1년여 만 300% 증가 등
tuxi0123@hankyung.com[사진=김기남 기자]
상단 바로가기