검색 상세

성김 기반 암묵신호제거 및 Wiener 필터를 이용한 음성향상 연구

A Study on Speech Enhancement Using Sparseness-Based Blind Signal Cancellation and Wiener Filtering

초록/요약

본 논문에서는 반향 잡음 환경하에서 두 개의 마이크로폰을 통해 녹음 된 음성신호를 강화하는 방법을 제안 한다. 원하는 음성 신호가 하나의 점 음원에서 발생 했다는 가정하에, 음성 신호는 Wiener 필터를 통해 강화 되는데 이를 위해서는 각 시간-주파수 영역별로 음성과 잡음의 크기를 추정하여야 한다. 기존에 제안된 방법은, 주파수영역에서의 암묵신호추출(FD-BSE)기법으로 음성 신호를 추출하고, 이를 역투사(PB) 한 뒤 관측 신호와의 크기 차로 분산 잡음 신호의 크기를 추정하였다. 제안하는 방법은 주파수 영역에서의 암묵신호제거(FD-BSC) 기법으로 분산 잡음 신호를 추출하였다. 추출된 잡음은 점 음원에서 발생한 잡음이 아니라 분산 잡음이기 때문에 역투사를 할 수 없어 기존의 방법처럼 관측 신호와 비교하여 음성신호의 크기를 구할 수 없다. 따라서 암묵신호제거 기법으로 추정한 계수의 역수로 구해지는 두 마이크로폰 신호의 빔포밍 결과와 함께 음성신호의 크기를 추정하는 방법을 함께 제안하였다. 컴퓨터 시뮬레이션 실험을 통해 제안하는 방법이 보다 정확하게 파라메터를 추정하며 signal-noise ratio(SNR)측면에서 보다 향상된 음성강화 성능을 제공함을 확인 하였다.

more

초록/요약

In this thesis, we propose a speech enhancement method using two microphone signals in the presence of diffuse background noise. Assuming there was a dominant point source corresponding to a target speech, the speech signal is enhanced by an Wiener filter with estimated speech and diffuse background noise power. In the previous method, the speech signal is extracted by frequency-domain(FD) blind signal extraction (BSE) method and the noise power is estimated by subtracting the projection backed (PB) speech signals from the observation signals. In the proposed method, the noise power is estimated by FD blind signal cancellation (BSC). The estimated noise power can’t be subtracted from the observation signals, because the noise signal is not a point source noise but a diffuse background noise. Therefor the speech power is estimated from beamforming result what is generated with negative value of the estimated BSC parameter. Experimental results show that the proposed method delivers more accurate parameter and better enhancement performance than the FD-BSE followed by the PB method.

more