검색 상세

이커머스 세분화된 행동 유형을 반영한 딥러닝 기반 고객 이탈 예측 모델

Deep Learning-Based Customer Churn Prediction Model Incorporating Segmented Customer Behavior in E-Commerce

초록 (요약문)

최근 커머스 시장이 오프라인에서 온라인으로 전환되면서 온라인 고객 확보뿐 아니라 고객 이탈 방지의 중요성이 부각되고 있다. 이에 따라 정확한 고객 이탈 예측을 통해 마케팅 효율을 높이고 비용을 절감이 요구되고 있다. 본 연구는 이커머스 고객의 세분화된 행동 유형별로 이탈을 차별화해 정의하고, 이를 기반으로 LSTM과 BiLSTM 을 활용한 딥러닝 고객 이탈 예측 모델을 제안한다. 기존 연구가 고객 이탈을 단일 기준으로 정의한 데 반해, 본 연구는 사용자 행동 유형(View, Cart, Purchase)마다 고유한 이탈 정의와 cutoff 기준을 설정하고, 각 행동에 따라 이탈 여부를 독립적으로 판별하는 방식을 적용했다. 또한 LRFM, 고객 행동, 타임스탬프 등의 정보를 자질 집합으로 구성해 정교한 모델 학습이 가능하도록 설계하고 이후 공정한 평가를 위해 모든 실험은 동일한 TPU 환경(메모리 335GB)에서 수행되었다. 이탈 예측을 위해 LSTM과 BiLSTM 모델을 각각 단층부터 다층까지 구성하여 실험하고, 로지스틱 회귀, XGBoost, MLP 등 전통적 기계학습 모델과 성능을 비교하였다. View 에서는 3-layers LSTM이 Accuracy 0.9107, F1 score 0.8856, ROC-AUC 0. 9617 로, Cart 에서는 2-layers BiLSTM이 Accuracy 0.8924, F1 score 0.8362, ROC-AUC 0.9405 로 Purchase에서는 1-layer BiLSTM 이 Accuracy 0.9197, F1 score 0.9395, ROC- AUC 0.9784로 우수한 성능을 나타냈다. 특히 행동 유형별 이탈 정의와 구조 최적화를 반영한 LSTM과 BiLSTM 기반 모델이 정밀도와 재현율에서 균형 잡힌 성능을 보였으며, 기존 모델 대비 높은 정확도와 ROC-AUC 값을 달성하였다. 이를 통해 행동 유형별로 최적화된 LSTM 과 BiLSTM 모델이 고객 이탈 예측 성능 향상에 기여함을 확인하였다.

more

초록 (요약문)

As the commerce market continues to shift from offline to online, preventing customer churn has become as important as acquiring new customers. Accurate churn prediction is essential for improving marketing efficiency and reducing costs. This study proposes a deep learning-based churn prediction model that leverages LSTM and BiLSTM architectures optimized for segmented customer behaviors in e-commerce. Unlike previous studies that defined churn based on a single criterion, this model applies differentiated churn definitions and cutoff thresholds for each behavior type (View, Cart, Purchase), enabling independent churn classification per behavior. A comprehensive feature set—including LRFM, customer activity, and timestamp-based features—was constructed to support robust model training. All experiments were conducted under the same TPU environment (335 GB memory) to ensure fair evaluation. The performance of LSTM and BiLSTM models, configured with varying layers, was compared with traditional machine learning models (Logistic Regression, XGBoost, MLP). The 3-layer LSTM showed the best performance for View (Accuracy: 0.9107, F1 score: 0.8856, ROC-AUC: 0.9617), while the 2-layer BiLSTM was optimal for Cart (Accuracy: 0.8924, F1 score: 0.8362, ROC-AUC: 0.9405). For Purchase, the 1-layer BiLSTM achieved the most balanced results (Accuracy: 0.9197, F1 core: 0.9395, ROC-AUC: 0.9784). The proposed LSTM and BiLSTM models, optimized by behavior type, demonstrated balanced precision and recall, outperforming traditional models. These results confirm that behavior-specific optimization of LSTM and BiLSTM enhances churn prediction performance in e-commerce.

more

목차

제 1 장 서론 1
제 1 절 연구 배경 및 목적 1
제 2 절 논문의 구성 3
제 2 장 선행 연구 및 이론 5
제 1 절 관련 연구 5
제 2 절 모델 선택 9
제 3 장 연구 설계 및 방법론 13
제 1 절 연구 데이터 셋 13
제 2 절 이탈 정의 13
제 3 절 자질 집합 정의 19
제 4 절 모델 구축 23
제 5 절 평가 지표 28
제 6 절 실험 환경 31
제 4 장 연구 결과 32
제 1 절 최종 모델 선택 32
제 2 절 최종 분석 결과 36
제 5 장 연구 결과 및 시사점 44
참고 문헌 46

more