검색 상세

DeBERTa 기반 Neural Collaborative Filtering을 활용한 영화 추천 시스템의 성능 향상 연구

A Study on Performance Improvement of Movie Recommendation Systems Using DeBERTa-based Neural Collaborative Filtering

초록 (요약문)

현대의 디지털 시대에서는 방대한 양의 정보 속에서 사용자에게 개인화된 추천을 제공하는 추천 시스템의 중요성이 날로 증가하고 있다. 특히 영화 추천 분야에서는 사용자의 취향을 정확하게 반영하는 것이 필수적이며, 이는 사용자 만족도와 플랫폼의 경쟁력을 좌우한다. 기존의 협업 필터링(Collaborative Filtering, CF) 기반 추천 시스템은 사용자-아이템 간의 상호작용 데이터를 활용하여 추천을 수행하지만, 새로운 사용자나 아이템에 대한 데이터 부족으로 인해 추천 성능이 저하되는 한계와 아이템의 내용적 특성을 충분히 반영하지 못하는 한계를 지니고 있다. 이러한 문제점을 해결하기 위해 본 연구에서는 대규모 언어 모델인 Decoding-enhanced BERT with Disentangled Attention (DeBERTa)를 활용하여 영화의 줄거리 텍스트를 임베딩하고, 이를 Neural Collaborative Filtering (NCF) 모델과 결합한 NCF_DeBERTa 모델을 제안하였다. 본 연구는 전통적으로 사용되어 온 MovieLens 100K 데이터셋에 TMDB API 를 활용하여 영화 줄거리(Plot), 장르(Genre), 감독(Director), 출연진(Cast) 등 다양한 메타데이터를 추가로 확보함으로써, 단순한 평점 정보에 치우친 기존 협업 필터링 모델을 넘어 콘텐츠 정보까지 풍부하게 반영할 수 있는 하이브리드 데이터셋을 구축하였다. 이 데이터를 바탕으로 모델을 학습시켰으며, 폴드 교차 검증을 통해 성능을 평가하였다. 평가 지표로는 RMSE (Root Mean Squared Error), MAE (Mean Absolute Error), MSE (Mean Squared Error), MAPE (Mean Absolute Percentage Error)를 사용하였으며, 대응표본 t-검정을 통해 통계적 유의성을 검증하였다. 실험 결과를 통해 DeBERTa 를 활용한 텍스트 임베딩이 추천 시스템의 예측 정확도를 향상시키는 데 효과적임을 입증하였으며, 콘텐츠 기반 정보와 협업 필터링의 결합이 추천 시스템의 성능을 극대화할 수 있는 가능성을 제시하였다.

more

초록 (요약문)

In the modern digital era, the importance of recommendation systems that provide personalized recommendations to users amidst vast amounts of information continues to grow. Particularly in the field of movie recommendations, accurately reflecting user preferences is essential, as it determines user satisfaction and platform competitiveness. Traditional Collaborative Filtering (CF)-based recommendation systems utilize user-item interaction data to make recommendations, but they face limitations such as degraded performance due to data sparsity for new users or items and insufficient consideration of item content characteristics. To address these issues, this study proposes an 𝑁𝐶𝐹_Deberta model that combines Neural Collaborative Filtering (NCF) with Decoding-enhanced BERT with Disentangled Attention (DeBERTa), a large language model used to embed movie plot texts. In this study, the model was trained using the MovieLens 100K dataset and metadata collected through the TMDB API, with performance evaluated through k-fold cross-validation. Performance metrics included RMSE (Root Mean Squared Error), MAE (Mean Absolute Error), MSE (Mean Squared Error), and MAPE (Mean Absolute Percentage Error), with statistical significance verified through paired t-tests. The experimental results demonstrated that text embedding using DeBERTa effectively improves the prediction accuracy of recommendation systems and suggested that combining content-based information with collaborative filtering can maximize recommendation system performance.

more

목차

제 1 장 서론 1
제 2 장 이론적 배경 및 관련 연구 5
제 1 절 추천 시스템 5
(1) 협업 필터링 6
(2) 전통적인 협업 필터링 7
제 2 절 Neural Collaborative Filtering 8
(1) NCF 모델 구조 9
제 3 절 텍스트 기반 추천 시스템 11
제 4 절 DeBERTa 14
제 3 장 제안 방법 20
제 1 절 문제 정의 20
제 2 절 제안 모델 21
제 4 장 실험 및 분석 29
제 1 절 실험 환경 29
제 2 절 데이터 셋 30
(1) MovieLens 30
(2) TMDB API 를 활용한 메타데이터 수집 30
(3)데이터 분포 시각화 33
제 3 절 평가 기준 37
제 4 절 실험 결과 39
제 5 절 통계적 유의성 검정 40
제 5 장 결론 45
제 1 절 실험 결과 및 시사점 45
제 2 절 향후 연구 47
(1) 사용자 리뷰 기반 감성 분석 48
(2) 감성 정보 피처 통합 전략 48
(3) 데이터 셋 규모 확대 49
References 50

more