Consolidating Inherent Interaction in Collaborative Filtering GAN-based Recommendation System
- 주제어 (키워드) Recommendation System , Generative Adversarial Network , Collaborative Filtering Model , Synthetic Recommendation Data
- 발행기관 서강대학교 정보통신대학원
- 지도교수 김홍석
- 발행년도 2024
- 학위수여년월 2024. 2
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제URI http://www.dcollection.net/handler/sogang/000000076746
- UCI I804:11029-000000076746
- 본문언어 영어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록
The amount of available internet information has exponentially increased in modern times. However, paradoxically, it has become difficult for us to find the necessary information easily, leading to an increased demand for personalized information provided by recommendation systems. Recommendation systems offer personalized information based on user preferences and past behavior. They are widely used in various aspects of our lives, such as online shopping product recommendations, YouTube and OTT content recommendations, and news recommendations. Various studies are being conducted for recommendation systems utilizing deep learning models in this context. However, recommendation data poses a fundamental problem of being sparse and noisy. This study introduces a new framework to alleviate the problem of sparse and noisy recommendation data, not just following the Ground Truth recommendation data distribution, but consolidating the Inherent Interaction factors between users and items based on Collaborative Filtering GAN (I2-GAN). The I2 -GAN is a framework that combines the Matrix Factorization Model with the Collaborative Filtering GAN, where the Matrix Factorization Model measures how well the prediction results generated by the Generator include user-item interactions. In other words, the proposed I2-GAN provides additional loss to the Generator so that inherent user-item interaction factors in the prediction results can be consolidated independently of the Ground Truth recommendation data through Matrix Factorization. In this work, I2 -GAN targets implicit data, representing the user’s indirect preferences, so we conduct experiments by converting the MovieLens-100k data into implicit data. Also, the hyperparameters applicable to CFGAN and Matrix Factorization were determined through grid search. Our experiments confirmed that the performance improved by a maximum of 3.685% Precision@5, 3.908% Recall@5, and 3.872% F1@5 compared to the baseline CFGAN.
more초록
오늘날 사용 가능한 인터넷 정보량은 비약적으로 증가하였다. 그러나 역설적으로 우리는 필요한 정보를 손쉽게 찾아내기 어려워졌고, 이에 따라 유저에게 개인화된 정보를 제공하는 추천 시스템의 필요성이 부각되었다. 추천 시스템은 유저의 선호도와 이전 행동 양식을 기반으로 개인화된 정보를 제공해주는 것을 의미하며, 온라인 쇼핑 상품 추천, YouTube 및 OTT 콘텐츠 추천, 뉴스 추천 등 다양한 형태로 우리 생활에 사용되고 있다. 이러한 배경 속에서 딥러닝 모델을 활용한 추천 시스템에 대한 다양한 연구가 진행되고 있으나, 추천 데이터는 sparse 하고 noisy 하다는 문제를 가지고 있다. 본 연구는 sparse 하고 noisy 한 추천 데이터의 본질적인 문제를 완화하기 위해, 정답 추천 데이터 분포만을 따르는 것이 아닌 user 와 item 간 내재된 상호작용 요소를 강화하도록 하는 새로운 프레임워크 I2-GAN 을 소개한다. I2-GAN 은 Collaborative Filtering GAN 에 Matrix Factorization Model 을 결합한 프레임워크로, Matrix Factorization Model 은 Generator 가 생성한 예측 결과가 user-item 상호작용을 얼마나 잘 포함하고 있는지 측정한다. 즉, 제안하는 I2-GAN 프레임워크는 Matrix Factorization 을 통해 정답 추천 데이터에 독립적으로 예측 결과에 내재된 user-item 상호작용 요소가 강화될 수 있도록 loss 를 Generator 에게 제공하는 것이다. 본 연구의 I2-GAN 은 유저의 간접적 선호를 나타내는 implicit 데이터를 대상으로 하고 있으며, 이를 위해 MovieLens-100k 데이터를 implicit 데이터로 변환하여 실험하였다. 또한 CFGAN 과 Matrix Factorization 에 적용 가능한 hyperparameter 는 grid search 를 통해 결정하였다. 우리는 실험 결과 baseline CFGAN 보다 최대 Precision@5 3.685%, Recall@5 3.908%, F1@5 3.872% 성능이 향상됨을 확인하였다.
more목차
I. Introduction 1
II. Related Works 5
2.1 Collaborative Filtering Model 5
2.1.1 Overview of Collaborative Filtering 5
2.1.2 Matrix Factorization 6
2.1.3 Fast Matrix Factorization using ALS Optimization 7
2.2 GAN-based Recommendation System 9
2.2.1 GAN for Image Generation 9
2.2.2 Conditional GAN 9
2.2.3 GAN for Recommend Systems 10
2.3 Research Utilizing Synthetic Data 13
III. Proposed Methods 14
3.1 Overview of I2-GAN 14
3.2 Consolidating Inherent Interaction Factor 16
IV. Experiments 18
4.1 Experimental Settings 18
4.1.1 Dataset 18
4.1.2 Implementation Details 19
4.1.3 Evaluation Metrics 20
4.2 Q1. How effective is I2-GAN compared to other models 21
4.3 Q2. Training time of I2-GAN 23
V. Discussion 24
VI. Conclusion 26
References 31