TabNet을 활용한 딥러닝 성능 비교와 설명가능한 AI 활용성에 대한 연구 : 기업 신용평가 모형을 중심으로
A Comparison of Deep Learning Performance Using TabNet with Explainable Artificial Intelligence (XAI): On the Credit Rating Model for Enterprise
- 주제어 (키워드) 신용평가 , 기업 신용평가 , 설명가능한 인공지능(XAI) , TabNet , 불균형데이터 , 이상치 , 딥러닝 , Credit Rating , Business Credit Rating , Explainable Artificial Intelligence (XAI) , TabNet , Unbalanced Data , Outliers , Deep Learning
- 발행기관 서강대학교 일반대학원
- 지도교수 이군희
- 발행년도 2022
- 학위수여년월 2022. 8
- 학위명 석사
- 학과 및 전공 일반대학원 경영학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000066825
- UCI I804:11029-000000066825
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록
늘어나는 기업 대출에 맞춰 은행권에서는 여신 리스크 관리의 필요성 대두된다. 이를 위하여 기업 신용평가 모형의 고도화가 필요한 실정이다. 기업 신용평가 고도화를 위하여 기업 재무정보를 활용한 통계, 머신러닝, 딥러닝 기법 활용 연구들이 활발히 진행되었다. 해당 연구들에서 사용된 대표적인 모델들은 전통적인 통계 기법인 로지스틱 회귀, 머신러닝 기법인 의사결정나무 기반의 모델들, 딥러닝 기법인 다층퍼셉트론 등이 있다. 기업 신용평가 연구에서 성능과 함께 집중해야 하는 내용은 결과에 대한 해석력과 불균형 데이터의 처리법이다. 본 연구에서는 성능을 위하여 새로운 변수를 생성하는 전처리법과 불균형 데이터를 처리하기 위한 샘플링, 그리고 딥러닝 기반의 설명가능한 인공지능(XAI)인 TabNet[6]을 활용한 프레임워크를 제안한다. 연구결과 로지스틱회귀, 다층퍼셉트론 대비 TabNet을 활용한 모형의 높은 성능을 확인하였다. 또한 결과를 분석하여 안정성, 수익성 지표가 예측에 크게 영향을 미쳤고, 성장성과 활동성 지표는 적게 영향을 미침을 확인하였다.
more초록
In line with the growing number of corporate loans, credit risk management is needed in the banking sector. To this end, it is necessary to upgrade the corporate credit rating model. In order to advance corporate credit evaluation, studies using statistics, machine learning, and deep learning techniques using corporate financial information were actively conducted. The representative models used in these studies include logistic regression, a traditional statistical technique, decision tree-based models, a machine learning technique, and a multi-layer perceptron, a deep learning technique. In corporate credit evaluation research, the content that should be focused on along with performance is the interpretation of the results and the processing method of unbalanced data. In this work, we propose a preprocessing method for generating new variables for performance, sampling for processing imbalanced data, and a framework using TabNet[6], an explainable artificial intelligence (XAI) based on deep learning. As a result of the study, the high performance of the model using TabNet was confirmed compared to logistic regression and multi-layer perceptron. In addition, by analyzing the results, it was confirmed that the stability and profitability indicators significantly affected the prediction, and the growth and activity indicators had a small effect.
more