검색 상세

사용자 발화의 의도 분석율 향상을 위한 음성 인식 결과 재순위화 모델

Reranking Model of ASR results for Improving the Understanding of User Utterance

초록/요약

대화시스템에서 사용자 발화의 의도를 분석하는 것은 매우 중요한 작업 중 하나이다. 일반적으로 사용자 발화의 의도를 분석하는 것은 음성 인식기의 1순위 음성 인식 결과를 바탕으로 이루어지기 때문에 음성 인식 결과에 많은 영향을 받는다. 그러나 음성 인식기는 발화의 의도와는 무관하게 어휘 오류율을 줄이는 방향으로 학습되고, 1순위 인식 결과를 선택한다. 따라서 N-best의 음성 인식 결과 중에서 음성 인식기가 내어준 1순위 후보가 항상 사용자의 의도를 가장 잘 반영한 후보라는 것은 보장되지 않는다. 사람과 사람 사이의 대화에서 이전 발화 의도 및 내용은 현재 발화에 큰 영향을 준다. 본 논문에서는 이 점을 착안하여 N-best 음성 인식 결과 후보 각각의 의도와 문맥정보를 사용한 재순위화 모델을 제안한다. 이 모델은 대화시스템에서 이전 발화의 문맥 정보와 각각의 사용자 발화 후보들에 내포된 의도 사이의 관계를 확률 모델로 모델링하여 음성 인식 결과를 재순위화 함으로써 사용자 발화에 대한 이해를 높일 수 있다. 실험을 통하여 본 논문에서 제안하는 재순위화 모델이 어휘 오류율뿐만 아니라 사용자 발화의 의도 분석 오류율을 감소시키는데 효과적이라는 것을 확인하였다.

more

초록/요약

In a dialog system, important is analyzing the intention of user’s utterance. Such an analysis is generally based on the top-1 result of automatic speech recognition (ASR) and thus influenced by the performance of ASR. But, a conventional ASR results included not only technical issues, but also other errors due to environmental factors, which has negative effects on ordering candidates that contain users’ intention as a top-1 result. Accordingly, a method to deliver candidates corresponding to the user intention as top-1 is needed in order to better analyze the intention of users’ utterance. In human-to-human dialogs, intention and contents of previous utterances affect current discourses. In this respect, this study proposes a new model that re-ranks the order of the candidates, giving the priority to the candidate that is most related to previous utterance. This model is developed based on the statistical probabilities between discourse information of previous utterances and users’ intention in each utterance candidates, and re-ranks the ASR results, so that it can enhance understanding of users’ utterances. This new model is able to select a candidate that is better corresponding to users’ intention than other candidates. In the experiments, the re-ranking model proposed in this study is confirmed that it reduces not only the word errors but also the errors of the intention analysis.

more