검색 상세

추천 시스템에서의 상호 학습 기법을 사용한 선호도 조작 검출 방법

Preference manipulation detection using co-training algorithm for a recommender system

초록/요약

Preference manipulation on recommendation systems provides incorrect information to on-line users and induces them to purchase items. If false information is provided, algorithm on the system becomes no longer reliable. To manipulate preference on recommendation systems, attacker use soft-bot that control preference of the system for their own interest. Attackers implement well-known attack model which is Random, Average, Bandwagon and Segment. To detect this attack, Researcher developed k-NN, C4.5, SVM which can recognize most of attacks. However, it becomes less accurate to detect especially when attacker target small amount of information to change preference on the system. These detection models have been shown that there are limitations if attacking pattern become changed and diverse. To improve this limitation, researchers proposed various detection models which use different algorithm simultaneously. Most recognized algorithm is Naive Bayes EM that can detect base attack, noise attack and hybrid attack. However, Naive Bayes EM also reveals some limitations if attacker manipulate small amount of item’s preference. This paper contribute a new detection model “Co-Training Algorithm” which combines C4.5, SVM and Naive Bayes EM to improve accuracy of detection. I find that Co-Training Algorithm is an efficient detection model that can reduce existing limitation of each algorithms and also can detect abnormal attacking pattern.

more

초록/요약

추천가 시스템에 대한 선호도 조작은 추천 알고리즘의 취약점을 이용하여 온라인 상거래를 사용하는 사용자에게 잘못된 정보를 제공하고 사용자가 해당 아이템의 구매를 유도하도록 하도록 만든다. 잘못된 정보가 다량으로 기입되면 해당 시스템의 알고리즘은 신뢰성을 잃게 된다. 선호도 조작을 위해서는 주어진 목적에 맞게 선호도를 기입하도록 소프트 봇을 다량으로 이용한다. 소프트 봇은 많은 문헌에서 공격자로 칭하고 있다. 과거에는 공격자의 행동 패턴을 무작위, 평균, 세그먼트, 밴드웨건 공격으로 구분할 수 있었고 이러한 공격을 검출하는 방법은 k-NN, C4.5, SVM이 사용되었다. 이들은 기본적인 공격은 대부분 검출하지만 공격자가 적은 수의 아이템에 접근하여 선호도를 기입할 경우 검출이 어려웠다. 더욱이 공격의 형태가 바뀌고 다양성을 가지게 되면서 기존의 검출 알고리즘의 한계가 드러났다. 이러한 상황에 대응하기 위해 서로 다른 알고리즘을 동시에 사용하는 방법이 제안되었다. 대표적인 알고리즘은 나이브 베이즈 EM이다. 이 방법은 기본적인 공격은 물론이고 노이즈 행동을 포함하는 공격자와 다양한 형태를 동시에 가진 공격자도 검출되었다. 그러나 공격의 크기가 작아지면서 검출 성능이 떨어지는 것이 발견되었다. 이것을 막기 위해 본 논문에서 설명하는 상호 학습 알고리즘은 C4.5, SVM, 나이브 베이즈를 동시에 학습하여 서로 간에 취약점을 강화 시키거나 자신이 분류하지 못하는 공격 패턴은 다른 알고리즘에서 처리하도록 한다. 이것은 어떠한 형태의 이상행동도 검출이 가능할 것으로 예상된다.

more