교통사고로 팔을 잃은 김아무개씨는 요즘 컴퓨터로 문서를 쉽게 작성할 수 있다는 마음에 기분이 들떠 있다. 편지 한 통을 쓰기 위해 기다란 막대기를 입에 물고 힘들게 자판을 두드리는 일은 더 이상 하지 않아도 되기 때문이다. 이젠 막대기 대신 컴퓨터에 연결된 마이크에 대고 말만하면 글을 쓸 수 있다.김씨와 같은 장애인이나 문서 입력이 많은 업무종사자의 귀를 솔깃하게 할 제품이 나왔다. 음성인식 기술 벤처인 보이스텍이 국내 처음으로 개발한 말을 하면 글이 쓰여지는 한글 딕테이션(받아쓰기) 소프트웨어가 그것이다. 딕테이션(Dictation)은 사람이 발음한 음성신호를 미리 정의된 기호나 문자로 전환시켜 주는 첨단 음성인식 기술이다.보이스텍이 2년간 총 1백여명의 개발인력을 투입해 개발한 ‘바이보이스(ByVoice)’는 아래아한글, 워드 등 워드프로세서를 기본으로 엑셀, 파워포인트 등 다양한 프로그램을 지원한다. 또 문서 작성뿐만 아니라 음성 명령으로 키보드 또는 마우스의 도움없이 인터넷 서핑, e메일 전송도 할 수 있다.단어·어절 인식 ‘지능형 프로그램’바이보이스는 보이스텍 음성처리연구소 개발자들의 밤낮없는 연구의 개가다. 이 개가의 가운데 프로젝트를 처음부터 끝까지 이끈 주인공이 바로 성원경(38) 보이스텍 음성처리연구소 언어처리팀 개발팀장이다.“바이보이스 인식률은 현재 92%에 이릅니다. 완벽하지 않지만 웬만한 단어와 어절은 모두 인식하는 셈이죠. 사실 한글 딕테이션 소프트웨어 개발은 한글 고유의 특성 때문에 많은 어려움이 있었습니다. 영어와 달리 수없이 파생되는 어절하며 문법 등이 문제였습니다. 이를 해결하기 위해 가능한 한 많은 어절을 데이터베이스화했습니다. 바이보이스가 보유하고 있는 언어 사전, 즉 어절 데이터는 2억5천만 어절입니다. 단어로 보면 5만 단어에 해당하죠.”성팀장은 이 정도 어절이면 한글로 표현하지 못할 것이 없다고 자신한다. 바이보이스는 방대한 어절뿐만 아니라 단어 의미를 결정하는 문법도 데이터베이스화했다. 그는 “‘일과 이는 다르다’라고 말했을 때 문맥상 일은 숫자 1을 의미하지만 일(work)로 해석할 수도 있다”며 “바이보이스는 이런 한글의 미묘한 의미까지 찾아 정확히 표시할 수 있는 지능형 프로그램”이라고 말했다. 바이보이스는 사용자의 음성을 인식하고 학습하는 기능도 갖고 있어 사용자가 말투나 발음습관 등을 가르치면 점점 인식률이 높아지고 신조어 외래어 등을 1만단어까지 추가할 수 있다. 성팀장은 “바이보이스는 사용자가 얼마나 트레이닝을 잘 시키느냐에 따라 인식률이 97%까지 올라갈 수 있다”고 설명했다.음성기술 분야의 획을 그을 만한 제품을 개발한 성팀장은 프로그램 개발자 이전에 언어학자에 가깝다. 그는 연세대에서 불어학을 공부했고 96년 프랑스 파리7대학에서 언어학을 전공, 자연어처리 분야 논문으로 박사학위를 받았다. 귀국 후 시스템공학연구소에선 언어를 기반으로 한 음성처리 기술연구에 매진했다. 그리고 세계적 음성기술 전문업체 L&H코리아와 인연을 맺으면서 한글 딕테이션 소프트웨어 개발을 시작했다. 그리고 지난해초 보이스텍으로 옮겨 연구를 계속해 최근 결실을 맺은 것이다. 성팀장은 “한글 딕테이션은 타자를 칠 수 없는 장애인은 물론 문서작성이 많은 의료 법률 분야 등까지 쓰임새가 넓다”며 “현재 이 분야 전문가용 소프트웨어를 개발하고 있다”고 향후 계획을 밝혔다.