인식률 90% 이상 기술력 확보, 브라우저·포털 등 음성 솔루션 등장 … 시장선점 각축

“김대리가 PDA에 대고 ‘신사동 교통상황’이라고 말한다. 그러자 ‘현재 정체, 다른길 이용 요망’이란 음성이 들린다. 다른 길로 빠져 나온 김대리가 다시 PDA에 대고 말한다. ‘한경비즈니스’. 그러자 단말기 화면에 한경비즈니스 홈페이지가 나온다. 미팅을 마치고 나온 김대리가 말한다. ‘오후 2시 박부장과 미팅 결과 좋음. 제품 샘플을 다음주 중에 주기로 했음. 물량과 할인율 등 조건만 맞으면 거래 성사될 것으로 판단됨.’ 이 말은 즉시 PDA 화면에 한글로 입력된다.”음성 인터넷 시대가 열린다. 마우스나 키보드가 아닌 목소리로 인터넷을 검색하고 각종 콘텐츠를 청취, 기록할 수 있는 음성 인터넷 시대가 본격 개막된 것이다. 현재까지 소개된 음성 솔루션은 음성 브라우저(Browser), 음성 포털(Portal), 음성 딕테이션(Dictation), 음성 도메인(Domain) 등이다.음성기술을 이용한 응용 솔루션들의 등장은 최대 걸림돌이었던 음성 인식률이 90% 이상으로 높아졌기 때문이다. 또 무선 인터넷 기술이 보편화한 것도 상용화를 부추기는 이유라고 전문가들은 말한다. 음성 관련 시장도 큰 폭으로 성장할 전망이다. 미국의 음성관련 시장조사 업체인 TMA어쏘시에이트는 전세계 음성 응용 솔루션 시장규모가 올해 53억6천만달러에 이르며, 2003년에는 3백80억달러로 증가할 것이라고 전망했다.음성 브라우저, “열려라 사이트”탤런트 장동건이 ‘쇼핑’ ‘ARS’ 등을 말로 외치며 빠르게 웹 서핑을 한다. SK생활인터넷 리빙오케이(livingok.com)의 TV CF다. 광고는 현실보다 과장돼 있지만 거짓은 아니다. 음성 브라우저를 채택했기 때문이다.음성 인식기술을 이용한 음성 브라우저 솔루션은 보이스웨어, 디앤엠테크놀로지, L&H, 보이스피아, 에오싸이버 등이 제품을 내놓았다. 보이스웨어는 지난 10월말부터 ‘voicebrowser’ 베타 버전을 무료로 배포하고 있다. 디앤엠테크놀로지도 솔루션 개발을 완료하고 PC 제조업체인 주연테크와 OEM 계약을 맺고 공급하고 있다. 벨기에 음성기술 전문업체인 L&H코리아는 SK와 협력을 맺고 리빙오케이에 솔루션을 제공했다.솔루션 업체가 제공하는 음성 브라우저에는 많이 사용하는 명령어나 사이트가 등록돼 있다. 별도로 사용자가 원하는 명령어나 사이트를 등록할 수도 있다. 하지만 등록하지 않은 사이트나 명령어는 실행시킬 수 없다. 현재 수준의 음성 브라우저는 미리 지정된 단어만 인식하기 때문. 관련 업계에서는 음성 브라우저가 앞으로 음성검색, 전자상거래 등으로 확대 적용되면 관련 시장은 더 커질 것이라고 입을 모은다.음성 포털, “말만하면 정보가 쏟아진다”흔히 음성 포털을 PC 앞에서 말로 원하는 정보를 불러오는 것으로 알고 있지만 사실과 다르다. 음성 포털은 유무선 전화를 통해 음성으로 인터넷 정보를 검색할 수 있는 솔루션이다. 예를 들어 전화를 걸어 뉴스 주식 날씨 영화 교통 레스토랑이라고 말하면 해당 정보와 서비스를 즉시 제공받을 수 있다. 국내는 보이시안닷컴, 헤이아니타코리아 등 음성 포털 전문업체들이 최근 문을 열고 본격적인 서비스에 들어갔다. 또 SK텔레콤 하나로통신 신세기통신 등 통신망사업자들도 음성 포털 서비스를 준비중이다. 음성 포털은 TTS(Text To Speech)라는 음성인식 및 합성 기술 때문에 가능하다. 음성인식은 사람의 목소리를 컴퓨터가 데이터로 인식하는 것이고 음성합성은 문자 데이터를 컴퓨터가 음성으로 합성해 사용자에게 기계음으로 들려주는 기술이다.보이시안닷컴(voician.com)은 지난 11월27일부터 정식 서비스에 들어갔다. 한국통신 전국 단일망을 이용하는 보이시안닷컴은 현재 뉴스 증권정보 영화소식 일기예보 교통 운세 e-메일 일정관리 주소록 유머 시 명상 등 12개 분야의 음성 정보를 제공한다. 사용자들은 회원 등록후 1588-0888에 전화해 원하는 정보를 말하면 들을 수 있다. 예를 들어 현재 영동대교 교통상황을 알고 싶으면 ‘교통’이라고 말한 뒤 다시 ‘영동대교’라고 말하면 교통상황을 들을 수 있다. 또 자신의 e-메일, 주소록, 일정관리 기능을 인터넷상에 저장해 두었다가 다시 음성으로 확인할 수 있다. 서비스 이용료는 없지만 1588-0888 시내통화료를 내야 한다. 박신규 사장은 “700 ARS는 녹음된 사람의 목소리를 듣는 것이지만 음성 포털은 전화를 건 사람의 목소리를 인식해 정보를 제공한다”며 ARS와 차원이 다르다고 말한다.미국의 음성 포털 전문업체인 헤이아니타(heyanita.co.kr)도 최근 지사를 세우고 12월5일부터 상용 서비스를 시작한다. 제공 콘텐츠는 뉴스 날씨 주식 교통 영화 레스토랑 등이며 앞으로 전자상거래와 홈뱅킹 증권거래 쇼핑 여행 등도 제공할 계획이다. 헤이아니타의 강점은 세계 어디서든 한국어 영어 등 10여 개국 언어를 사용할 수 있다는 것. 국내에서 헤이아니타 서비스를 이용하려면 회원 등록후 국번없이 030311를 돌리면 된다. 이용료는 없고 사용한 시내 전화요금만 내면 된다. 이외 제나웨이, L&H, 보체웹닷컴 등이 음성 포털 서비스를 준비하고 있다.음성 딕테이션, “말하면 기록된다”휴대폰이나 컴퓨터에 대고 말을 하면 글자(워드)가 기록된다. 말을 문자로 변환해주는 딕테이션(구술) 솔루션이다. 현재 SL2 보이스웨어 보이스텍 엑트밸리 등이 내년 초를 겨냥해 제품 개발에 한창이다.지난 10월에 딕테이션 기술을 선보인 SL2(slworld.co.kr)는 내년 2월께 상용제품을 출시할 예정이다. 회사측은 음성 인식률이 93%에 달하며 특정인의 음성만 인식하는 화자종속형으로 PC에 설치하면 MS워드 한글 등에서 사용할 수 있다고 밝혔다. 보이스텍(voicetech.co.kr)은 딕테이션 프로그램 ‘바이보이스(By voice)’ 개발을 완료하고 테스트중이다. 상용제품은 내년 2월경에 나올 예정이다. 바이보이스는 현재 인식률이 80% 정도이며 내년 정식제품은 90%대에 이를 것이라고 이 회사 성광석 부장은 말했다. 이 제품은 MS워드 엑셀 파워포인트뿐만 아니라 한글에서도 활용 가능하다. 보이스텍은 벨기에 업체 L&H로부터 기술을 이전받아 개발했다. 보이스웨어(voiceware.co.kr)도 내년 상반기 목표로 제품을 개발중이다. 현재 대용량 연속음성인식 알고리즘을 개발 완료한 상태다. 이 회사 이윤근 연구소장은 “현재 음성 인식률은 80% 정도”라며 “한글 MS워드 등과 연동 사용할 수 있는 화자독립형 딕테이션 프로그램”이라고 말했다. 이외 엑트밸리(actvalley.com)가 딕테이션 프로그램 개발을 위해 미국업체와 접촉중이다.이외 음성으로 사이트를 찾고 이동할 수 있는 음성 도메인 등록 서비스와 음성인식 사이트 구축 저작도구도 등장했다. 음성 도메인은 사람의 음성만으로 특정 인터넷 사이트에 접속할 수 있는 서비스다. 도메인천사(domain1004.com)는 한국음성도메인센터와 손잡고 12월부터 서비스에 들어갔다. 뉴로네티즘(neuronetism.com)은 미국 IBM의 음성인식 기술 비아보이스를 이용해 음성인식 언어교육 사이트 구축 툴을 개발했다.