검색 상세

텍스트 마이닝 기반 리뷰 서비스 개선 방안 도출

Analysis of Potential for Improvement of Review Services based on Text Mining

초록 (요약문)

본 연구는 네이버 플레이스 플랫폼의 음식점 리뷰 데이터를 크롤링하여 리뷰 서비스의 효과성과 개선 가능성을 분석하였다. 특히, 플랫폼이 제공하는 ‘구매 인증 단계’와 ‘키워드 선택 시스템’이 실제 사용자 경험을 얼마나 반영하고 있는지 검토하였다. 이를 위해 빅데이터 텍스트 마이닝 기법을 활용하여 구조적 문제점을 분석하고, 서비스 개선에 필요한 실질적인 방향을 제시하였다. 온라인 리뷰는 음식점 선택 과정에서 소비자들에게 중요한 정보를 제공하며, 플랫폼의 신뢰성과 서비스 품질을 좌우하는 핵심 데이터로 기능한다. 그러나 리뷰 작성 및 검증 시스템이 사용자 경험과 실제 음식점 특성을 충분히 반영하지 못하는 경우, 리뷰 서비스의 신뢰성과 효율성이 저하될 가능성이 높다. 이에 본 연구는 리뷰 데이터 생성 과정에서의 구조적 문제를 규명하고, 소비자 경험을 더 효과적으로 반영할 수 있는 플랫폼 설계 방안을 모색하였다. 감성 분석 결과, ‘구매 인증 단계’는 긍정 비율 조절에 유의미한 영향을 미치지 않는 것으로 나타났다. ‘구매 인증 단계’가 없는 플랫폼에서는 음식점별 긍·부정 평가가 다양하게 분포하여 긍정적인 평가의 전체 평균 비율이 상대적으로 낮았다. 반면, ‘구매 인증 단계’가 강력한 플랫폼에서는 대부분의 음식점 리뷰가 긍정적인 평가에 집중되며, 긍정적인 평가 비율이 낮아지지 않고 오히려 높게 유지되는 동시에, 리뷰의 긍·부정 평가가 다양하기보다 긍정 평가에 쏠리는 경향을 보였다. 이는 광고성 리뷰 방지와 리뷰의 객관성 강화를 위해 인증 단계를 도입하는 것을 넘어, 어뷰징 탐지 시스템과 같은 정교한 데이터 기반 해결책이 필요함을 시사한다. ‘키워드 선택 시스템’ 분석에서는 제공된 48개의 키워드 중 상위에 제시된 키워드에만 집중되는 현상이 빈도 분석을 통해 확인되었다. TD-IDF 분석과 LDA 토픽 모델링 결과, 플랫폼에서 제공하는 키워드가 실제 소비자 경험과 불일치함을 검증하였다. 이를 바탕으로 카테고리별로 특화된 맞춤형 키워드를 제공하고, 키워드 수를 줄여 리뷰 작성의 편의성과 신뢰성을 향상시키는 방향을 제안하였다. 본 연구는 축적된 리뷰 데이터를 활용하는 데 초점이 맞춰졌던 기존 연구들과 달리, 사용자가 생성하는 리뷰 콘텐츠와 그 작성 과정을 분석하여 양질의 리뷰를 확보하기 위한 과정 자체에 집중했다는 점에서 학문적·실무적 의의가 있다. 이는 리뷰 시스템의 구조적 개선과 사용자 친화적 설계를 위한 구체적이고 실질적인 방안을 제시하였으며, 플랫폼 신뢰성과 소비자 만족도를 제고하기 위한 중요한 기초 자료로 활용될 것으로 기대한다.

more

초록 (요약문)

This study analyses restaurant review data from the Naver Place platform to evaluate the overall effectiveness of and suggest potential measures for improvement of the review service. Primary focus are the 'purchase verification procedure', the 'keyword selection system' and the determination of how well aligned these steps are with the actual experience of users. Through text mining structural issues of the service were discovered, and accordingly practical recommendations for improvement were developed. Analysis of the effectiveness of the purchase verification step shows that paid promotional reviews cannot effectively be blocked and that high quality reviews cannot be guaranteed by this step. Although this step works as a hurdle to review writing, external factors may have counteracted its intended impact on positive review ratios. This points to the need for more sophisticated, data-driven measures, such as abuse detection systems, to prevent paid promotional reviews and increase the credibility of reviews. Sentiment analysis of the 'keyword selection system' revealed that despite the provision of 48 keywords, users mostly relied on the keyword options shown at the top during review writing. TD-IDF and LDA topic modeling confirmed that these keywords did not align well with user experiences. Measures such as providing category-specific keywords and reducing the number of suggested keywords could facilitate the review writing process for users and lead to overall more authentic and credible reviews. This research is significant in that unlike precious research that mainly focused on ways of utilizing accumulated reviews, user-generated content in itself is being analyzed with the goal of providing means of improving the quality of reviews. It offers practical solutions for improving the structure of the review system and user experience with the service, boosting credibility of the service and review quality. Future studies should expand the sample band with and categories in their analyses to gain deeper insights on possible improvement measures for review services.

more

목차

1. 서론 1
1.1 연구의 배경 1
1.2 연구 대상 2
1.3 연구의 구성 6
2. 선행 연구 9
2.1 온라인 리뷰 9
2.2 텍스트 마이닝 기반 리뷰 분석 10
2.3 리뷰 작성 행위의 이론적 배경 12
2.4 리뷰 작성 환경 설계와 심리학 이론 13
3. 연구 방법 17
3.1 분석 자료 17
3.2 분석 절차 18
3.3 분석 도구 19
3.4 데이터 수집과 전처리 23
3.5 텍스트 마이닝 27
4. 연구 결과 30
4.1 리뷰 작성 방식에 따른 감성분석 결과 30
4.2 빈도 분석을 통한 '키워드 선택 시스템' 검증 결과 39
4.3 TF-IDF 분석을 통한 '키워드 선택 시스템' 검증 결과 44
4.4 LDA 토픽 모델링 결과 48
5. 결론 64
5.1 연구 결론 및 시사점 64
5.2 연구 의의 및 한계 66
참고문헌 70

more