검색 상세

상담대화를 위한 검색, 재순위화, 대화 기록 어텐션을 사용한 응답 생성 시스템

Response Generation System with Retrieval, Reranking and Dialog History Attention for Customer Center Dialogue

초록 (요약문)

최근에도 많은 콜센터들에서 상담 대화들이 이루어지고 있다. 실생활의 많은 부분을 차지하고 있는 상담 대화들의 자동화는 중요한 가치를 지닌다. 상담 대화는 같은 내용의 반복이 많으므로 상담원의 응답 유형이 한정적이다. 따라서 상담원과 사용자의 대화에서 문맥-응답 짝들(context-response pair)을 데이터베이스에 저장해 놓았다가 나중에 불러와서 응답을 선택하는 방식이 가능하다. 이와 같은 상담 대화의 특징 때문에 과거에 검색 기반 모델을 사용한 연구가 많이 진행되었다. 하지만 검색 모델은 대화할 때 주어진 문맥과 일치하거나 매우 유사한 문맥이 데이터베이스에 존재하지 않으면, 검색된 문맥과 짝지어진 응답이 적절하지 않을 수 있다는 문제점이 있다. 문제점을 보완하기 위해 본 논문에서는 reranking 용도로 응답 선택 모델을 추가하여 검색 성능을 높이고, 검색 모델과 생성 모델을 결합함으로써 적절한 응답이 검색되지 않더라도 응답을 생성하여 구한다. 본 논문에서 제안하는 Dialog History Attention을 추가한 응답 선택 모델로 문맥을 더 상세하게 고려하여 응답을 선택함으로써 검색 성능이 향상됨을 실험을 통해 증명하였다. 다음으로 응답 생성 모델을 사용하는 것은 다음과 같은 장점이 있다. 단순히 fully-connected layer로 구성된 classifier를 통해 응답을 선택하는 검색 모델과는 달리, GPT decoder의 cross-attention을 활용하여 주어진 context의 정보를 더 풍부하게 반영하여 응답을 생성할 수 있다. 하지만 응답 생성 모델만을 사용하게 되면 응답이 너무 다양한 유형으로 생성되어 유형이 제한된 상담대화에서 원하는 응답이 나올 확률이 낮아지고, 문맥과 관련된 중요한 정보들이 누락 될 수 있다. 본 논문에서는 reranking모델에서 선택된 10개의 발화를 생성 모델의 input으로 사용함으로써 검색된 텍스트를 기반으로 하는 응답 생성을 수행한다. 생성 모델만 사용하는 것에 비해 응답 유형을 제한하고, 문맥과 관련된 풍부한 정보를 담아서 생성할 수 있다. 이를 증명하기 위해 제안하는 결합 모델의 성능이 생성 모델만 사용했을 때의 성능보다 뛰어나다는 것과 검색 기반 모델의 성능보다도 우수하다는 것을 실험을 통해 보였다.

more

초록 (요약문)

Even recently, consultation dialogue are taking place in many call centers. Automation of consultation dialogue, which occupy a large part of real life, has significant value. Consultation dialogue has many repetitions of the same content, so the agent's response type is limited. Therefore, it is possible to select a response by storing context-response pairs in the database and calling later in the conversation between the agent and the user. Because of these characteristics of consultation dialogue, many studies using retrieval-based models have been conducted in the past. However, the retrieval-based model has a problem in that a response paired with the retrieved context may not be appropriate if there is no context that matches or is very similar to the given context at the time of conversation. In order to resolve the problem, in this paper, a response selection model is added for reranking to improve search performance, and a response is generated and obtained even if an appropriate response is not found by combining the retrieval-based model and the generative model. It was proved through experiments that the retrieval performance is improved by selecting responses by considering the context in more detail with the response selection model with the addition of Dialog History Attention proposed in this paper. Next, using the response generation model has the following advantages. Unlike a retrieval model that selects a response through a simple classifier composed of fully-connected layers, a response can be generated by reflecting more abundant information of a given context by using the cross-attention of the GPT decoder. However, if only the response generation model is used, the response is generated in too many different types, which reduces the probability of a desired response in a consultation dialogue with limited types, and important information related to the context may be omitted. In this paper, we perform response generation based on the retrieved text by using 10 utterances selected from the reranking model as inputs to the generative model. Compared to using only the generative model, response types can be limited and responses containing rich information related to the context can be generated. To prove these, our experiments have shown that the performance of the proposed combined model is superior to that of the generative model alone and that of the retrieval-based model.

more