GAN 기반 이상자금거래 방지에 관한 연구
A Study on the Financial Fraud Detection System using GAN
- 주제어 (키워드) GAN , FDS , 이상자금거래방지 , 이상자금거래 , 자금횡령사고 , 통합자금관리서비스 , 자금사고방지시스템
- 발행기관 서강대학교 정보통신대학원
- 지도교수 김세준
- 발행년도 2023
- 학위수여년월 2023. 2
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000070195
- UCI I804:11029-000000070195
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
최근 대규모 자금 횡령 사건이 최근 잇따라 발생하면서 기업의 이상거래탐지 시스템 (fraud detection system, FDS) 도입이 강조되고 있다. FDS는 실시간 거래 정보를 빠르게 분석하여 이상거래를 탐지 및 차단하고 전자금융사고를 방지할 수 있도록 하는 것이 핵심이다. FDS는 의심스러운 거래를 식별하기 위해 기존의 사기 패턴을 분석한 Rule 시나리오 (즉, Black List) 기반으로 운영되어왔다. 하지만, 결제 수단의 다양화 및 전자금융거래의 증가에 따라 치밀해져 가는 금융사기 (Fraud)를 기존 Rule 기반의 FDS로는 탐지하기 어려워지고 있다. 잦 은 미탐율과 오탐율 한계를 극복하기 위해, 머신러닝과 딥러닝 기술을 적용하 여 이상거래 탐지율을 향상하고, 탐지 결과의 반영을 자동화하고자 하는 연 구가 증가하고 있다. 머신러닝 FDS 구축에서 핵심 문제는 데이터 Class 불균형과 이상거래 패턴 의 변동이다. 대부분의 경우 불균형 데이터셋 (imbalanced dataset)으로 인해 모델의 성능이 저하되는 것을 해결하기 위해 SMOTE(Synthetic Minority Over- sampling TEchnique)와 같은 오버샘플링 방법을 사용하게 된다. 하지만 SMOTE 의 경우 다른 클래스의 데이터와의 거리를 고려하지 않아 생성된 데이터의 클래스 중첩 (overlapping of class)이 일어날 수 있는 문제 가 있으며 고차원 데이터 (high dimensional data)에는 적합하지 않다. 본 논문에서는 이 문제를 해결하기 위해 적대적 생성 신경망 (GAN, Genera tive Adversarial Network)을 이용하여 이상거래 탐지에 사용되는 불균형 데이터 문제를 해결할 방안을 제시한다.본 연구에서는 Generative Adversarial Networks (GAN)의 여러 모델을 활용한 오버샘플링 기법을 통해 데이터 불균형 문제를 개선하고, FDS 분류기로서 머신러닝 네 가지 모델 (Adaboost, DecisionTree, MLP, XGBoost)을 비교하고자 한다. 실험 결과, 오버샘플링을 하였을 때 FDS 분류기로써 Adaboost의 성능이 가 장 성능이 높게 나왔다.
more초록 (요약문)
Recently, a series of large-scale embezzlement cases have occurred, emphasizing the introduction of a company's FDS (Fraud Detection Syste m). The key of FDS is to quickly analyze real-time transaction informati on to detect and block abnormal transactions and prevent electronic fina ncial accidents. FDS has been operated based on a Rule scenario (i.e., Black List) tha t analyzed existing fraud patterns to identify suspicious transactions. However, with the diversification of payment methods and the increase in electronic financial transactions, it is becoming difficult to detect fi nancial fraud that is becoming more dense with existing rule-based FDS. In order to overcome frequent undetection and false detection rate lim itations, there is an increasing number of studies that apply machine le arning and deep learning technologies to improve abnormal transaction de tection rates and automate the reflection of detection results. A key problem in machine learning FDS construction is data class imbal ance and variation in abnormal transaction patterns. In most cases, over sampling methods such as Synthetic Minority Over-sampling TEchnique (SMO TE) are used to address the degradation of the model's performance due t o an unbalanced dataset. However, in the case of SMOTE, there is a problem that overlapping of classes of generated data may occur because the distance from other clas ses of data is not considered, and it is not suitable for high-dimension al data. To address this problem, this paper presents a solution to the problem of imbalanced data used for anomaly detection using Generative Adversari al Networks (GANs). In this work, we try to improve the data imbalance p roblem through oversampling techniques using several models of Generativ e Adversarial Networks (GAN), and compare the four machine learning mode ls (Adaboost, DecisionTree, MLP and XGBoost) as FDS classifiers. Experimental results showed that the performance of Adaboost is the most excessive model as a FDS classifier.
more