RAG를 이용한 마케팅 전략 활용에 대한 연구 : 신용카드 할부 이용 고객 예측을 중심으로
Research on the Application of RAG in Marketing Strategies: Primary Focus on Prediction of Customers with Credit Card Installment Payment
- 주제어 (키워드) RAG(Retriecal-Augmented Generation) , LLM(Large Language Model , LLM) , 신용카드 할부 , Logistic Regression , 트리 기반 앙상블 모형 , RAG (Retrieval-Augmented Generation) , LLM (Large Language Model) , Credit Card Installment , Logistic Regression , Tree-Based Ensemble Model
- 발행기관 서강대학교 일반대학원
- 지도교수 이군희
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 석사
- 학과 및 전공 일반대학원 경영학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000079740
- UCI I804:11029-000000079740
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
신용카드는 국내에서 가장 흔히 사용되는 결제 수단이지만, 신용카드사는 각종 규제로 인해 수익성 유지에 어려움을 겪고 있다. 기존의 연구가 주로 신용카드 이용 행태나 리스크 분석에 초점을 맞춰왔다면, 본 연구는 신용카드사의 수익성을 향상시킬 수 있는 신용카드 할부 이용 예측에 중점을 두고 있다. 본 연구에서는 대규모 및 소규모 데이터를 활용하여 다양한 예측 모델의 성능을 비교 분석하였고, 특히 RAG 기반의 LLM 모델을 도입하여 이의 유효성을 검증하였다. 대규모 샘플에서는 전통적인 통계 모델 및 결정 트리 기반의 앙상블 모델을 사용하여 신용카드 할부 이용 여부를 예측하였다. 소규모 샘플에서는 기존 평가 모델과 더불어 Logistic Regression 수식 기반의 LLM 및 RAG 기반의 LLM 모델을 도입하여 그 성능을 평가하고, 데이터 기반 마케팅 인사이트를 도출하는 데 그 유용성을 평가하였다. 연구 결과, 대규모 샘플에서는 Random Forest 모델이 가장 높은 예측 정확성을 보였다. 반면 소규모 샘플에서는 RAG 기반 LLM 모델이 뛰어난 예측 성능을 나타냈으며, 특히 신규 고객의 특성을 분석하고 이를 기반으로 한 개인화된 마케팅 전략을 수립하는 데 큰 가능성을 보였다. 본 연구에서는 RAG 기반 LLM 모델이 기존 예측 모델과 유사한 성능을 제공하면서도 추가적인 마케팅 전략의 인사이트를 제공하는 데 유용한 도구가 될 수 있음을 시사한다. 더 나아가, AI Agent와 같은 애플리케이션을 활용하여 “RAG – 분석 – 전략 도출” 과정을 자동화할 수 있는 가능성을 제시하였다.
more초록 (요약문)
A credit card is one of the most commonly used payment methods. However, due to various regulatory constraints, credit card companies are going through significant challenges maintaining profitability. While previous research mainly concentrated on analysis of credit card usage patterns or risks derived from credit card usage, this study primarily aims to address the prediction of credit card installment payment use that could increase the profitability of credit card firms. In this study, various predictive models were compared based on performance using both big data and relatively small-scale datasets, and Large Language Model (LLM) based on Retrieval Augmented Generation (RAG) was utilized to evaluate its efficacy. In the bigdata datasets, traditional statistical models and decision tree-based ensemble models were used to predict credit card installment payment usage. For the smaller datasets, in addition to the traditional statistical models, the study incorporated LLM with basis of Logistic Regression and LLM with basis of RAG to evaluate their predictive accuracy and retrieve potential marketing insights. The results were revealed in the highest predictive accuracy from Random Forest Model in the large sample. On the other hand, RAG-based LLM demonstrated superior predictive performance in the small sample. RAG-based LLM especially excelled in analyzing characteristics of new customers and forming a personalized marketing strategy. This study suggests an idea that the utilization of utilizing RAG-based LLM can be a valuable tool in providing similar predictive performance as traditional statistical models while contributing additional insights on marketing strategy. Furthermore, the study proposes the feasibility of automating the process of “RAG-Analysis-Strategy” through deployment of applications like AI Agent.
more목차
제 1 장 서론 1
제 1 절 연구 배경 1
제 2 절 선행 연구 및 변수 선정 5
제 2 장 이론적 배경 7
제 1 절 Logistic Regression 및 결정 트리 기반 앙상블 기법 7
1. Logistic Regression 7
2. 결정 트리 기반 앙상블 기법 8
2-1. Random Forest 8
2-2. XGBoost 9
2-3. LightGBM 9
제 2 절 대규모 언어 모델 10
1. LLaMA 10
2. RAG(Retriecal-Augmented Generation) 11
3. 벡터 스토어 12
제 3 장 연구 모형 및 분석 13
제 1 절 데이터 설명 13
1. 활용 데이터 13
2. 데이터 전처리 및 최종 고려 변수 14
제 2 절 평가 지표 18
1. 정확도, 정밀도, 재현율 18
2. F1-Score 19
3. Area Under the ROC Curve(AUC) 20
제 3 절 분석 결과 (Large Sample) 21
제 4 장 LLM 모델을 활용한 할부 이용 예측 24
제 1 절 LLM을 활용한 예측 모형 26
1. Logistic Regression 수식 기반 LLM 26
2. RAG 기반 LLM 29
3. 분석 결과 (Small Sample) 32
제 2 절 RAG 기반 LLM을 활용한 마케팅 인사이트 도출 33
제 5 장 결론 37
제 1 절 연구 결과 요약 및 시사점 37
제 2 절 향후 연구 방향 38
참고문헌 40
국내 문헌 40
국외 문헌 42