검색 상세

콜센터 음성인식 성능향상을 위한 LM(Language Model) 적응에 관한 연구

초록/요약

통계적 언어 모델은 콜센터 음성인식 시스템의 성능에 직접적인 영향을 준다. 하지만 모든 분야를 충족시키는 언어 모델을 만드는 것은 사실상 불가능 하다. 이에 이번 논문에서는 언어 모델을 새로운 영역으로 적응 하는 과정을 연구해 보았으며 동일한 텍스트 코퍼스를 어절 및 형태소로 변환하였을 경우 동일 조건(어휘 사전이 같고, 훈련용 트레이닝 데이터가 동일하며 같은 테스트 데이터를 가지고 측정)하에서 어떤 유형으로 변환하였을 경우가 성능이 가장 좋아 지는지도 검증하고자 하였으며 적응 훈련만 거친 LM과 MAP(Maximum a Posteriori)된 LM 모델을 사용하여 얼마만큼의 성능개선이 이루어지고 최적의 LM 생성을 위한 적응 코퍼스의 최적의 문장수를 확인해 보고자 하였다. 실험은 대용량 코퍼스, 트레이닝 코퍼스, 테스트 코퍼스 3가지를 어절/형태소로 변환 후 기준 언어 모델, 적응 후 언어 모델, MAP 적용 후 언어 모델로 만든 후 Perplexity(혼잡도)를 측정 이를 비교분석 하였으며 트레이닝 코퍼스의 경우 총 6단계의 누적 데이터를 사용하여 최적의 문장수를 확인해 보고자 하였다. 비교분석 결과 어절에 비하여 형태소로 변환 하였을 경우 16배 정도의 성능이 좋아지는 것을 확인 하였으며 적응 훈련 만 거친 LM 과 MAP 적용 된 LM의 경우 MAP 적용 된 LM 이 6.88%정도의 성능개선이 이루어지는 것을 확인 할 수 있었다. 총 6단계로 나눈 트레이닝 데이터의 측정 값에서는 TD4(16,826 Line)가 가장 최적의 문장수임을 확인하였다.

more