검색 상세

전자결제 사기 탐지를 위한 신뢰도·시간 가중치 결합 부스팅 모델

초록(요약문)

전자 결제 사기 탐지(Credit Card Fraud Detection)는 거래 시점과 사기 확 정 시점 사이의 시간 차이로 인해 라벨 지연(label delay) 문제가 빈번하게 발 생한다. 이러한 라벨 지연은 최신 거래 데이터의 불완전한 라벨을 포함시켜 모델의 학습 과정을 왜곡하고 탐지 성능을 저하시킨다. 실무 환경에서는 복잡 한 딥러닝 모델보다 구현과 유지보수가 용이하고 CPU 환경에서 빠르게 동작 하는 Boosting 모델(XGBoost, LightGBM, CatBoost)이 널리 활용되고 있으나, 기존 Boosting 모델은 라벨 지연 문제를 내부적으로 반영하지 못한다는 한계 가 있다. 이를 해결하기 위해 Boosting 모델의 실무적 장점을 유지하면서 Proxy Label 기반의 신뢰도 가중치(Confidence Weight)와 시간 가중치(Time Decay Weight)를 결합한 경량 개선 프레임워크를 제안한다. 신뢰도 가중치는 각 데 이터의 라벨 예측 불확실성을 정량화하여 학습 과정에서 신뢰할 수 있는 샘플 의 영향을 강조시키며, 시간 가중치는 최신 거래에 더 높은 중요도를 부여하 여 사기 패턴의 시간적 변화를 반영한다. 이 방법은 기존 Boosting 모델의 구 조를 변경하지 않고 손실 함수 수준에서 적용 가능하여 실무 도입이 용이하다. IEEE-CIS Fraud Detection 데이터셋(636만 건, 사기율 3.5%)을 활용하여 XGBoost, LightGBM, CatBoost 세 가지 부스팅 모델에 제안 방법을 적용하였 으며, 라벨 완성 기간(W_days)을 1일에서 90일까지 변경하며 성능을 평가하 였다. Ablation Study를 통해 두 가중치의 독립적 기여도를 검증한 결과, LightGBM 모델에서 W_days=60일 조건으로 AUPRC 0.6218, F1-score 0.5153, 추론시간 43.67초를 달성하여 가장 우수한 성능을 기록하였다. Ablation Study 분석 결과, 신뢰도 가중치가 핵심적인 역할을 수행하였으며, 시간 가중치는 약 1% 내외의 보조적 개선을 제공하였다. W_days 분석에서는 60일 구간에서 이미 최적에 가까운 성능에 도달하였고, 90일로 확장 시 추가 향상은 미미하였다(AUC 0.80%p, F1 1.57%p). 이는 약 60일의 히스토리 데이 터로 효율적인 모델 운영이 가능함을 시사한다. 신뢰도 가중치와 시간 가중치를 결합한 통합 프레임워크를 통해 라벨 지연 문제를 효과적으로 해결하였으며, 실무 적용을 위한 최적 시간 윈도우(60일) 가이드라인을 제시하였다. 제안 방법은 복잡한 모델 구조 변경 없이 Boosting 모델의 계산 효율성과 해석 가능성을 유지하면서 성능을 개선할 수 있어, 사 기 탐지뿐만 아니라 사용자 이탈 예측, 신용 위험 평가 등 라벨 지연이 발생 하는 다양한 도메인에 적용 가능하다. 키워드: 신용카드 사기 탐지, 라벨 지연, 신뢰도 가중치, 시간 가중치, Proxy Label, XGBoost, LightGBM, CatBoost, 불균형 데이터, Boosting 모델

more

초록(요약문)

Credit card fraud detection frequently encounters the label delay problem due to the time gap between transaction occurrence and fraud confirmation. This label delay distorts the model training process by incorporating incomplete labels from recent transaction data, thereby degrading detection performance. In practical environments, Boosting models (XGBoost, LightGBM, CatBoost) are widely adopted due to their ease of implementation and maintenance, and fast operation in CPU environments, rather than complex deep learning models. However, existing Boosting models have limitations in that they cannot internally reflect the label delay problem. To address this issue, we propose a lightweight improvement framework that combines Proxy Label-based confidence weighting and time decay weighting while maintaining the practical advantages of Boosting models. The confidence weight quantifies label prediction uncertainty for each data point and emphasizes the influence of reliable samples during training, while the time weight assigns higher importance to recent transactions to reflect temporal changes in fraud patterns. This method can be applied at the loss function level without modifying the existing Boosting model structure, facilitating practical deployment. Using the IEEE-CIS Fraud Detection dataset (6.36 million transactions, 3.5% fraud rate), the proposed method was applied to three boosting models— XGBoost, LightGBM, and CatBoost—and performance was evaluated while varying the label completion period (W_days) from 1 to 90 days. The independent contributions of both weights were validated through Ablation Study. The LightGBM model achieved the best performance under W_days=60 conditions, recording AUPRC of 0.6218, F1-score of 0.5153, and inference time of 43.67 seconds. Ablation Study analysis confirmed that confidence weighting performed a critical role, while time weighting provided approximately 1% auxiliary improvement. In the W_days analysis, near-optimal performance was already achieved at the 60-day window, with marginal additional improvements when extending to 90 days (AUC +0.80%p, F1 +1.57%p). This suggests that efficient model operation is possible with approximately 60 days of historical data. Through an integrated framework combining confidence and time weighting, the label delay problem was effectively addressed, and an optimal time window (60 days) guideline for practical application was presented. The proposed method can improve performance while maintaining the computational efficiency and interpretability of Boosting models without complex model structure changes, making it applicable not only to fraud detection but also to various domains experiencing label delay, such as customer churn prediction and credit risk assessment. Keywords: Credit Card Fraud Detection, Label Delay, Confidence Weighting, Time Weighting, Proxy Label, XGBoost, LightGBM, CatBoost, Imbalanced Data, Boosting Models

more

목차

제1장 서론 1
제2장 이론적 배경 및 관련 연구 5
제1절 신용카드 Fraud Detection의 데이터 구조적 특성 5
제2절 전통적인 머신러닝 접근: Boosting 모델 6
제3절 딥러닝 기반 접근: GNN 및 신경망 모델 8
제4절 라벨 지연(Label Delay) 문제와 기존 연구의 한계 9
제5절 본 연구의 위치: 실무 적용 가능한 경량 개선 방법 11
제3장 라벨 지연 문제 정의 및 제안 방법론 13
제1절 라벨 지연(Label Delay) 문제 정의 13
제2절 데이터 전처리 및 파생 변수 생성 14
제3절 제안 모델 아키텍처 15
제4절 가중치 설계 17
4.1 신뢰도 가중치(Confidence Weight) 18
4.2 시간 가중치(Time Decay Weight) 및 파라미터 탐색 18
제4장 연구 데이터 및 실험 환경 22
제1절 실험 환경 및 데이터 셋 개요 22
제2절 Fraud 분포 및 데이터 특성 24
제5장 실험 결과 28
제1절 AUC 성능 분석 28
제2절 F1-Score 성능 분석 30
제3절 AUPRC 성능 분석 33
제4절 모델별 성능 특성 36
제5절 Precision과 Recall 분석 38
제6절 시간 윈도우 크기의 영향 39
제7절 실험 종합 결과 41
제6장 결론 45
제1절 연구 기여 45
제2절 연구의 한계 46
제3절 향후 연구 방향 48
제4절 실무 적용 권장사항 49

참고문헌 52

more