검색 상세

음성과 반향 필터의 사전정보를 이용한 비음수 행렬 분해 기반 음성 반향 제거

Speech Dereverberation Based on Non-negative Matrix Factorization with Speech and Filter Prior Imposition

초록/요약

This thesis describes a single-channel speech dereverberation method in the short-time Fourier transform domain. With the approximation that the magnitude spectra of the reverberated speech is a convolution of that of its clean speech and a reverberation filter, each can be estimated using maximum-a-posteriori estimation. For that, the prior impositions, which are the sparsity and the dependency across frequencies, for a speech and exponential decaying property for a filter are proposed to be used. Furthermore, the clean speech and reverberation filter are estimated by using non-negative deconvolution as an extension of non-negative matrix factorization. Subsequently, improved dereverberated speech is estimated without inaccurate speech prior imposition. The effectiveness of the algorithm was demonstrated with experimental results on speech reverberated by room impulse responses.

more

초록/요약

본 논문에서는 단구간 푸리에 변환 도메인에서의 적은 연산량으로 좋은 성능을 보이는 단일 채널 음성 반향 제거 알고리즘을 소개한다. 이를 위해 반향 음성의 세기를 원 음성과 반향 필터의 세기의 컨볼루션 형태로 나타낼 수 있음을 보였으며, 이것으로부터 최대 사후 확률 추정법을 사용해 원 음성을 추정할 수 있음을 설명하였다. 또한, 음성의 성김 특성화 주파수 종속 특성 및 반향 필터의 시간에 대한 지수감소 특성을 설명하고, 이를 각각의 사전 정보로 활용하는 것을 제안하였다. 그 후 비음수 디컨볼루션 알고리즘을 활용하여 구하고자 하는 원 음성을 빠르게 추정할 수 있음을 보였다. 마지막으로, 반향 제거 후의 음성 왜곡 및 부정확한 사전 정보로 인한 악영향을 최소화하기 위해 추정된 반향 필터를 사용하여 음성을 재추정하는 방법을 제안하였다. 모의 반향 환경에서의 실험 결과 제안하는 방법은 기존의 방법이 가지고 있는 문제점을 해결할 수 있었으며, 동시에 더 좋은 성능을 얻을 수 있었다.

more