상품 수요 패턴과 클러스터를 고려한 월간 상품 수요 예측 모델 성능 비교 연구
A Comparative Study on the Performance of Monthly Product Demand Forecasting Models in Relation with Product Demand Pattern and Cluster
- 주제어 (키워드) 수요예측 , 수요패턴 분석 , k-means 클러스터링 , 정상성 , 머신러닝 예측 모델 , XGboost , Demand Forecasting , Demand Pattern Analysis , k -means clustering , Stationarity , Machine Learning Forecasting , XGboost
- 발행기관 서강대학교 정보통신대학원
- 지도교수 김세준
- 발행년도 2023
- 학위수여년월 2023. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000076543
- UCI I804:11029-000000076543
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
유통업계에서의 상품 수요 예측은 공급망 관리의 중요한 측면이며, 이를 정확하게 예측할수록 기업은 예상 수요에 맞춰 공급을 조정하고 공급망 관리 계획을 세움으로써 이익을 얻고 효율성을 높인다. 하지만 최근 상품의 종류 및 특성들이 과거보다 더욱 다양해지고 이에 따라 수요량의 추세도 다양해지고 있어 상품 수요 예측이 점차 어려운 과제가 되고 있다. 본 연구에서는 XGboost 모델을 활용하여 시계열 상품별 수요 예측을 진행하면서, 예측 대상 상품을 수요패턴 별로 분류하고, 각 패턴 내에서 과거 수요량을 기반으로 2차 클러스터링 한 후, XGboost 시계열 예측 모델에 독립변수로 쓰일 각 그룹에 적합한 Sliding Window 사이즈를 선정해 상품 수요 예측 성능을 높이는 방안을 제안한다. 실험 데이터로는 Kaggle에서 제공하는 Online Retail Dataset을 사용하였다. 해당 데이터는 2년 동안의 온라인 쇼핑몰 거래 이력 데이터로 구성되어 있다. 데이터 중에서 시계열 정상성을 가지는 상품 996 개를 선별하였으며, 이를 기반으로 상품별 수요 패턴을 수요 발생 구간(average demand interval, ADI)과 변동 계수(coefficient of variation, CV)를 사용하여 smooth, lumpy, intermittent, erratic 네 가지 패턴으로 분류하였다. 각 수요 패턴 내에서는 과거 6개월 동안의 월별 수요량을 사용하여 k-means 클러스터링을 수행하였고, 이를 통해 2차 클러스터링을 진행하였다. 이렇게 구성된 16개의 그룹에 대해 적합한 Sliding Window 사이즈를 선택하여 수요 예측을 수행한 결과 일괄적으로 같은 Sliding Window 사이즈를 적용한 경우보다 평균적으로 0.23의 더 우수한 수량 정확도를 얻을 수 있었다. 제안된 방법을 활용하면 다양한 수요 추세를 가지는 상품의 예측 시에 각 그룹의 특성을 고려하여 시계열 수요 예측 성능을 향상시킬 수 있을 것이라 기대한다.
more초록 (요약문)
Demand forecasting in the retail industry is a critical aspect of supply chain management. Accurate predictions enable businesses to adjust supply and optimize supply chain planning to maximize profitability and efficiency. However, with the increasing variety and complexity of products in recent years, coupled with diverse demand patterns, predicting product demand has become increasingly challenging. In this study, we employ XGboost model to perform demand forecasting for individual products based on time series data. We classify the target products into different demand patterns and conduct second-level clustering based on historical demand. Furthermore, we propose selecting suitable sliding window sizes for each group, which serves as independent variables in XGboost time series prediction model, to enhance the accuracy of product demand forecasting. We utilize the Online Retail Dataset provided by Kaggle as the experimental data. This dataset comprises two years of online shopping transaction history. We select 996 products with time series stationarity for analysis and classify them into four demand patterns (smooth, lumpy, intermittent, erratic) based on average demand interval (ADI) and coefficient of variation (CV). Within each demand pattern, we perform k-means clustering using monthly demand data from the previous six months, followed by a secondary clustering process. This results in 16 distinct groups. By selecting appropriate sliding window sizes for these groups and conducting demand forecasting, we achieve an average improvement of 0.23 in quantity accuracy compared to using a uniform sliding window size. We expect that our proposed approach can enhance the performance of time series demand forecasting for products with diverse demand trends by considering the characteristics of each group.
more