[HELLO AI=AI뉴스]
[한경비즈니스=이현주 기자] 인공지능(AI) 전문 기업 솔트룩스는 ‘한국어 방언 AI 데이터’ 구축 사업에 필요한 각 지역별 사투리 데이터 수집 인력을 모집한다고 11월 4일 밝혔다.
솔트룩스는 정부의 디지털 뉴딜 사업의 하나인 ‘한국어 방언 AI 데이터’ 구축 사업의 주관사다. 이 사업은 과학기술정보통신부와 한국정보화진흥원(NIA)이 주최·주관하는 ‘AI 학습용 데이터 구축’ 사업 중 하나로 추진되는 것으로, AI가 각 지역별 사투리도 잘 알아들을 수 있도록 AI 학습용 방언 데이터를 대규모로 수집, 가공하는 프로젝트다.
솔트룩스는 15년 이상의 초대규모 학습용 데이터를 구축한 전문성을 바탕으로 주관사를 맡고 지역 언어, 데이터 구축, 품질 검수 등 부문별 전문성을 보유한 15개 기관이 함께 참여하는 컨소시엄으로 사업을 진행하고 있다.
‘한국어 방언 AI 데이터’ 구축 사업은 일반 대중이 참여하는 크라우드 소싱(사회적 인력 활용) 방식을 통해 데이터 수집 인력을 대면·비대면으로 모집해 진행하는 것이 특징이다. 모집 분야는 특정 주제에 대해 사투리로 이야기를 녹음하는 ‘화자’, 녹음된 사투리를 타이핑하는 ‘전사’, 녹음·전사된 파일의 품질을 검수하는 ‘검수’ 등 총 3가지로 구분된다.
charis@hankyung.com
[본 기사는 한경비즈니스 제 1302호(2020.11.09 ~ 2020.11.15) 기사입니다.]