검색 상세

아이템 기반 속성을 활용한 추천 시스템의 허위 공격 감지 : Shilling attack detection in recommender systems utilizing item-based features

초록/요약 도움말

추천 시스템이란 사용자들의 행동 패턴을 분석해서 사용자에게 적합한 아이템 정보를 제공 해주는 시스템을 말한다. 이는 자료가 방대 해지면서 텍스트 검색만으로는 원하는 정보를 찾기 어려운 사용자들에게 정보를 찾는 시간을 줄여준다. 또한 사용자에게 흥미있는 정보를 제공하면서 서비스 호감도 증가로 이어져 마케팅 분야에서 중요시 되고 있다. 추천 시스템의 중요성이 대두되면서 이를 악용하는 사용자들이 생겨나기 시작했다. 이들은 자신의 아이템이 사용자에게 추천되도록 하거나, 경쟁사 아이템이 사용자에게 추천되지 못하도록 선호도 데이타를 조작하여 추천 시스템에 기입한다. 보다 효과적으로 선호도 데이타를 조작하기 위해 무작위 공격, 평균 공격, 밴드웨건 공격, 세그먼티드 공격, 선호 아이템 공격 모델들이 연구되었고 이러한 공격 모델을 감지하기 위해 다양한 알고리즘들이 연구 되었다. 감지하는 다양한 알고리즘 중 본 논문에서는 공격 모델들의 특징을 감지하기 위한 엔트로피, Degsim, LengthVar, FMTD, RDMA 속성을 정의하고, 정의된 속성들을 조합하여 나이브 베이지안 알고리즘으로 감지하는 방법을 소개한다. 대부분의 공격 모델에는 아이템간의 관계를 고려하지 않은 무작위로 선출한 아이템의 선호도가 포함되어 있는데, 기존에 공격을 감지하기 위해 제안한 속성에는 아이템의 평균을 이용한 것 외에는 아이템 정보를 이용하지 않았다. 그래서 본 논문에서는 아이템 유사도를 이용한 속성과 아이템의 평균, 표준 편차를 이용한 속성을 제안했다. 선행 연구에서 제안한 속성과의 감지하는 정도를 보기 위해 각각의 속성 들을 이용하여 실험을 진행하였다. 공격 모델은 무작위 공격, 평균 공격, 밴드웨건 공격 모델을 이용했다. 그리고 정상 데이타의 5%, 10%, 20% 조작 데이타를 넣어서 실험하였고 정밀도, 재현율, 정확도, f-measure를 측정했다. 실험을 통해 아이템 기반 정보를 이용한 속성이 허위 공격을 감지하는데 효과가 있는 것으로 확인되 었다.

more

초록/요약 도움말

A recommender system refers to a system that analyzes the behavioral patterns of users and offers item information fit for them. Such a system helps to cut down the time for users to spend on finding information when text search alone is not enough to find the desired information due to the increasingly vast volumes of data. A recommender system also provides information that users find interesting and leads to increased preference for service, thus being considered to be important in the field of marketing. The emerging importance of a recommender system, however, was accompanied by its abusers, who manipulate preference data and enter them in the recommender system to have their items recommended to the users or those of their competitors not recommended to them. In an attempt to manipulate preference data more effectively, research was conducted on the random, average, bandwagon, segmented, and favorite item attack models and further on various algorithms to detect those attack models. Of the various detection algorithms, this thesis introduced the one that defined the attributes of entropy, Degsim, LengthVar, FMTD, and RDMA, put the defined attributes together, and detected the characteristics of the attack models with the Naïve Bayesian Algorithm. Most attack models include the preference of a randomly selected item with no consideration of item relations. The old features proposed to detect an attack used no item information other than the mean of items. The thesis thus proposed an feature using item similarity and another one using item average and standard deviation. The thesis conducted an experiment with each of those features to examine their detection degrees compared with the attributes proposed in the previous studies, using the random, average, and bandwagon attack models. The investigator included manipulated data that accounted for 5, 10, and 20% of normal data in the experiment and measured precision, recall, accuracy, and f-measure. It was verified that the features using item data would be effective for detecting shilling attacks in the experiment.

more