검색 상세

협력적 필터링과 컨텐츠 정보를 결합한 영화 추천 알고리즘

Movie Recommendation Algorithm Combining Collaborative Filtering and Content Information

초록/요약

추천가 시스템은 기계 학습의 한 분야로서, 사용자의 관심을 고려하여 새로운 추천 아이템을 예측하는 방법이다. 대부분의 추천가 시스템은 협력적 필터링 또는 컨텐츠 기반의 방법을 사용하고 있다. 협력적 필터링은 사용자의 피드백, 즉 주어진 도메인에서 각 아이템에 일정 형식의 평가 점수를 주었을 때의 유형을 다른 사용자와의 유사성이나 차이점을 비교하여, 어떻게 아이템을 추천할 것인가를 결정하는 방법이다. 반면에, 컨텐츠 기반의 방법은 아이템이 가지고 있는 컨텐츠, 그리고 사용자가 가지고 있는 컨텐츠에 대한 흥미도에 기반해서 추천하게 된다. 두 방법은 각자의 장점을 가지고 있지만, 각각의 상황에 따라 알맞은 추천결과를 내지 못하기도 한다. 두 방법들의 이점들을 통합하여 구성하는 하이브리드 추천가 시스템은 여러 상황에서 일어나는 각 방법들의 단점을 극복할 수 있다. 본 논문에서는, 컨텐츠 기반의 필터링과 협력적 필터링을 효과적으로 통합할 수 있는 구조를 소개한다. 제안하는 방법은 컨텐츠 정보를 기존의 사용자-아이템간의 관계 정보에 더하고, 이를 이용하여 협력적 필터링 기법을 통해 개별화된 추천을 하게 된다. 이러한 방법을 통해 데이터의 더 다양한 양상을 살펴 볼 수 있다. 먼저, 컨텐츠 기반의 필터링과 잠재 인자 모델의 장점을 이용하여 예측 성능을 향상시키기 위해 두 모델을 통합하는 방법에 대해서 설명한다. 그리고 컨텐츠 기반 모델과 협력적 필터링의 여러 방법 중 좋은 성능을 보여주고 있는 SVD++ 모델과의 통합 과정에 대해 설명한다. 마지막으로, 제안한 방법과 기존의 방법들을 비교하여 성능을 비교하였다. 제안한 컨텐츠 정보를 이용한 협력적 필터링 기법은 컨텐츠 기반의 필터링이나, 협력적 필터링 기법만 이용한 모델에 비해 높은 성능을 보여주었다.

more

초록/요약

Recommender Systems, one of the Machine Learning tasks, attempt to predict new items of interest for a user. Most recommender systems use Collaborative Filtering or Content-based methods. Collaborative filtering systems work by collecting user feedback in the form of ratings for items in a given domain and exploit similarities and differences among profiles of several users in determining how to recommend an item. On the other hand, content-based methods provide recommendations by comparing representations of content contained in an item to representations of content that interests the user. While both methods have their own advantages, individually they fail to provide good recommendations in many situations. Incorporating components from both methods, a hybrid recommender system can overcome these shortcomings. In this paper, we present an effective framework for combining content-based filtering and collaborative filtering. Our approach uses a content information for model the relation between users and items to enhance existing data, and then provides personalized suggestions through collaborative filtering. First, we explain the ways of combining model that improves prediction accuracy by capitalizing on the advantages of both content-based filtering and latent factor approaches. And we discuss integrating our content-based model to SVD++. Then we compare the performance of our approach with others. We present experimental results that show how this approach, Collaborative Filtering using Content information, performs better than a pure content-based predictor, pure collaborative filter.

more