심층 강화 학습을 사용한 온톨로지 기반 유저 성향에 따른 개인화된 추천시스템
Personalized Recommendations on Ontology-based Preferences using Deep Reinforcement Learning
- 주제(키워드) Context-based Ontology , Recommendation System , Partially Observable Markov Decision Process , Bayesian Rules , User Feedback , Deep Reinforcement Learning
- 발행기관 서강대학교 일반대학원
- 지도교수 오경환
- 발행년도 2018
- 학위수여년월 2018. 8
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000063419
- UCI I804:11029-000000063419
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
추천 시스템은 사용자에게 개인화된 컨텐츠 및 서비스를 제공함으로써 최근 몇 년 동안 인기를 얻고 있다. 협업 필터링은 많은 사용자로부터 개인 정보를 수집하여 예측을 하는 기법이다. 이러한 시스템은 대규모 양의 데이터에서 사용자에게 유용한 정보를 추출하는 데 활용되지만, 특정 사용자의 의도는 파악하는데 어려움을 갖는다. 이 논문은 사용자의 배경 지식을 온톨로지에 설계하며, 유저 친화적인 질문을 구성한다. 또한, 심층 강화 학습을 사용하여 유저에게 적합한 최적의 질문을 제공한다. 사용자에 대해 알기 위해 체인 추론 알고리즘을 적용한다. 이 시스템은 질문에 대한 유저의 답변에 따라, POMDP에서 사용자의 영화 선호도를 반영한다. 마지막으로, 영화 추천에 대한 만족도를 고려하기 위하여, 사용자의 피드백을 받는다. 최적화된 개인화 추천 경로를 찾기 위해 시스템은 심층 Q 네트워크를 통해 학습되어진다.
more초록/요약
Recommendation systems have become increasingly popular in recent years by providing users with personalized content and services. Collaborative filtering is a technique to make automatic predictions by collecting personal information from many users. Such systems are sufficient to deal with extracting useful information from users in a large dataset, but they are not aware of particular user intentions for the interest-based recommendations. This thesis shows an interactive recommendation system using Deep reinforcement learning with user-friendly questions from ontologies that contains the background of user information. To know about the users, forward chaining reasonings by approaching users with the chained question paths is applied. And, the system is maintained by belief states to reflect user movie preferences in POMDP. The system also obtains user’s explicit feedbacks to consider their satisfaction about movie recommendations. To find the personalized path, the system is trained in deep Q-network with user-given rewards by optimizing the highest Q-values to interpret personalized movie preferences.
more