日 악성 민원인 목소리 바꿔주는 신기술 개발


일본 기업이 악성 민원인의 억양이나 목소리를 부드럽게 바꿔주는 AI 활용 기술을 개발했다. 이 기술을 적용하면 말하는 사람의 목소리가 거의 실시간에 가까운 0.08초 만에 변경된다.

18일 닛텔레뉴스 NNN 등 현지 매체는 일본 최대 통신사 NTT가 생성 AI를 활용한 음성변환 기술을 개발했다고 보도했다.

보도에 따르면 이 기술을 통해 화자의 목소리를 좋아하는 캐릭터 등 원하는 스타일로 바꿀 수 있다. 또 콜센터에서 걸려 오는 위압적인 목소리를 온화하게 변경하거나, 외국어를 할 때 유창한 발음으로 변환해 주는 등 다양한 상황에서 응용이 가능하다.

특히 일본에서는 악성 민원인의 괴롭힘을 뜻하는 ‘카스하라’가 만연한 만큼, 언론들은 목소리와 억양을 부드럽게 바꿀 수 있는 이 신기술이 근로자의 스트레스를 감소시켜 줄 것으로 기대하고 있다.

NTT는 "이 기술이 웹 회의 등에서 실시간 음성 변환이 가능하다”며 "앞으로는 스마트폰이나 VR 디바이스 등 다양한 상황에서의 활용을 기대한다"고 말했다.

해당 기술은 오는 24일 개최되는 커뮤니케이션 과학 기초 연구소 오픈 하우스 2024에서 선보일 예정이다.

김민주 기자 minjoo@hankyung.com
상단 바로가기