딥러닝 학습의 판별 성능 증대를 위한 부스팅 활용에 대한 연구 : 신용평가모형을 중심으로
- 발행기관 서강대학교 일반대학원
- 지도교수 이군희
- 발행년도 2018
- 학위수여년월 2018. 2
- 학위명 석사
- 학과 및 전공 일반대학원 경영학과
- 실제URI http://www.dcollection.net/handler/sogang/000000062928
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
본 연구에서는 이미지 인식과 자연어 처리 등 다양한 분야의 데이터 분석에서 뛰어난 성능을 보여주는 심층신경망(Deep Neural Network) 모형과 P2P대출 데이터를 이용하여 AS(Application Score) 모형을 개발하고 판별이 어려운 그레이 존(Gray Zone)에 속하는 차주들의 판별 성능을 높이기 위하여 확률에 기반한 부스팅 기법을 제안한다. 최근 국내 P2P(Peer to Peer) 대출 시장의 누적 대출액은 2016년 9월 2,916억 원에서 2017년 9월 1조 4,730억 원 규모로 1년 사이 약 5배 가량 급격하게 증가하고 있다. 자금이 필요한 차주에게 다수의 개인이 온라인과 오프라인 P2P대출 플랫폼을 통해 대출을 실행하고, 추후 차주로부터 일정기간 원리금을 상환받는 방식으로 운영된다. P2P 대출은 제도권 금융기관에서 대출을 받기 어려운, 즉 기존 신용평가체계에서 그레이 존(Gray Zone)에 속하는 중신용자 및 씬 파일러(Thin Filer)에게 적절한 대안금융이 되고 있다. 신용평가시스템(Credit Scoring System)에서 그레이 존(Gray Zone)이란 우량과 불량 어느 곳에도 속하지 않으며, 구분하기 모호한 특징을 가진 신용등급 구간을 의미한다. 이 신용등급 구간에 속하는 차주들은 모형으로부터 우량, 불량을 판단하기 어려워 제도권 금융기관에서는 일반적으로 대출이 거절된다. 하지만 최근 상승하는 누적 대출액과 더불어 P2P 대출의 연체율이 2017년 7월 0.54%에서 2017년 10월 6.01%, 부실율은 2017년 7월 0.32%에서 2017년 10월 1.12%로 상승하는 경향을 보이고 있다. 이는 상당수의 P2P 이용자들이 판별이 어려운 중신용자 혹은 저신용자이기 때문으로 볼 수 있으며, 리스크관리에 부담이 되고 있다. 금융상품으로 분류되는 P2P 대출은 부도 발생 시 그 피해가 고스란히 투자자의 몫으로 이어지므로 투자자의 보호와 P2P 대출의 효과적인 리스크관리를 위해선 중신용 구간에 특화된 신용평가모형이 필요하지만 아직 관련 연구는 미비한 실정이다. 본 연구에서 제안하는 확률기반 부스팅은 모형에서 계산되는 판별확률의 높고 낮음에 따라 부스팅에 사용될 데이터를 선정, 학습하여 모형의 성능을 강화에 목적이 있다. 이는 그레이 존에 속하는 차주들의 분류율을 높이고 리스크 부담을 줄이기 위해 활용될 수 있으며, 실제로 전체 분류성능의 향상이 있음을 확인하였다. 데이터는 미국의 P2P 대출 업체인 렌딩클럽(Lending Club)에서 제공하는 2014년도와 2015년도의 고객정보 데이터를 이용하였다. 실증분석 결과 전통적인 이진분류 모형인 로지스틱회귀분석과 기본적인 심층 신경망 모형과 비교하여 분류성능이 향상됨을 확인할 수 있었고, 또한 모형에서 그레이존에 속하는 집단의 차주들의 특성을 확인하였다.
more