검색 상세

머신러닝 및 딥러닝 모델을 이용한 개인 신용 리스크 예측 성능 비교 분석

Performance Comparison Analysis of Personal Credit Risk Prediction Using Machine Learning and Deep Learning Models

초록 (요약문)

본 연구는 개인 신용 리스크 예측을 위해 머신러닝 및 딥러닝 모델의 성능을 비교 분석하고, 딥러닝 모델의 네트워크 구조 변경이 예측 성능에 미치는 영향을 평가하였다. HELOC 데이터는 대출 연체 여부를 목표 변수로 하는 신용 평가 데이터로, 이를 활용하여 로지스틱 회귀, 의사결정나무, 서포트벡터머신(SVM), XGBoost 등의 머신러닝 모델과 CNN, RNN 등의 딥러닝 모델의 예측 성능을 비교하였다. 특히, RNN 모델에서 정규화, Dropout, 양방향 학습(Bidirectional)의 네트워크 구조를 단계별, 조합별로 적용하여 어떤 하이퍼파라미터 변화가 모델 성능 향상에 유의미한 영향을 미치는지 확인하였다. 분석 결과, 머신러닝 모델에서는 SVM, 하이퍼파라미터 튜닝을 거친 XGBoost가 우수한 성능을 보였으며, 딥러닝 모델에서는 커널 사이즈 3의 CNN 모델과 RNN 네트워크에 Dropout 기법을 적용했을 때 가장 높은 정확도와 일반화 성능이 나타났다. 본 연구는 신용 리스크 평가를 위한 최적화된 모델 설계와 네트워크 구조 변화가 미치는 영향을 확인함으로써, 향후 금융권의 신용 평가 모델 개발에 중요한 시사점을 제공한다.

more

초록 (요약문)

This study compares the performance of machine learning and deep learning models for personal credit risk prediction and evaluates the impact of network structure modifications on the predictive performance of deep learning models. The HELOC dataset, which uses loan delinquency status as the target variable, was employed to compare the predictive performance of machine learning models such as logistic regression, decision tree, support vector machine (SVM), and XGBoost, as well as deep learning models like convolutional neural networks (CNN) and recurrent neural networks (RNN). In particular, for the RNN model, network structures, including normalization, dropout, and bidirectional learning, were applied step-by- step and in combination to identify the hyperparameter changes that have a significant impact on model performance improvement. The analysis results indicate that among the machine learning models, SVM and hyperparameter-tuned XGBoost exhibited superior performance. For deep learning models, CNN network with kernel size three and the RNN network with dropout demonstrated high accuracy and generalization performance. This study provides critical insights into the design of optimized models and the impact of network structure modifications for credit risk assessment, offering valuable implications for the development of credit evaluation models in the financial sector.

more

목차

제 1 장. 서론 1
1.1 연구 배경 및 목적 1
1.2 논문의 구성 3
1.3 연구 방법 및 범위 3
제 2 장. 이론적 배경 4
2.1 신용평가 시스템의 이론적 배경 4
2.2 머신러닝 기반 신용리스크 예측 연구 동향 4
2.3 신용평가를 위한 주요 머신러닝, 딥러닝 기법 5
2.3.1 로지스틱 회귀 5
2.3.2 의사결정나무 6
2.3.3 서포트벡터머신 6
2.3.4 XGBoost 6
2.3.5 CNN 7
2.3.6 RNN 7
제 3 장. 연구 방법론 8
3.1 제안하는 방법 8
3.1.1 실험 데이터 개요 및 설명 8
3.1.2 데이터 전처리 11
(1) 특수값 처리 11
(2) 변수 정규화 11
(3) 범주형 변수 인코딩 11
3.1.3 모델 적용 방법 12
(1) 머신러닝 12
(2) 딥러닝 (RNN, CNN) 13
3.2 모델 성능 평가 지표 17
3.2.1 Accuracy(정확도) 17
3.2.2 F1 Score 18
제 4 장. 분석 결과 19
4.1 머신러닝 모델별 성능 비교 19
4.2 딥러닝 모델(RNN, CNN)의 성능 확인 20
4.3 RNN 네트워크 구조 변경에 따른 성능 비교 22
4.3.1 단계별 RNN 네트워크 구조 변경 22
4.3.2 RNN 네트워크 구조 조합 25
제 5 장. 결론 및 시사점 28
5.1 연구 요약 및 한계점 28
5.2 향후 연구 방향 30
참고문헌 32

more