거시경제변수를 활용한 머신러닝과 롤링 OLS의 코스피 지수 예측력 비교
Comparison of the Predictive Power of Machine Learning and Rolling OLS for the KOSPI Index Using Macroeconomic Variables
- 주제어 (키워드) 코스피 , 머신러닝 , 수익률 예측 , 금융 , 거시경제 , KOSPI , machine learning , return prediction , finance , macroeconomics
- 발행기관 서강대학교 일반대학원
- 지도교수 김재호
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 석사
- 학과 및 전공 일반대학원 경제학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000079854
- UCI I804:11029-000000079854
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
This study aims to compare and evaluate the performance of a rolling window-based Ordinary Least Squares (OLS) method that accounts for time-varying coefficients and machine learning techniques in forecasting monthly returns of the KOSPI index. Random Forest and XGBoost were selected as the primary machine learning models, and their predictive performance was assessed using four measures: Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), the accuracy of directional forecasts, and cumulative returns. Empirical results show that the rolling OLS model performed exceptionally well in terms of both directional predictability (64.18%) and cumulative returns (80.54%), which can be attributed to its ability to capture dynamic changes over time by reflecting variations in coefficients caused by economic events. In contrast, nonlinear machine learning models such as Random Forest and XGBoost exhibited relatively limited performance in directional forecasting and cumulative returns. These findings suggest that, with limited and lowfrequency financial data, traditional statistical models may outperform machine learning models, particularly highlighting the usefulness of rolling OLS in accounting for timevarying coefficients. This study proposes a reevaluation of traditional regression models as an alternative approach to enhance predictive performance in the Korean stock market.
more초록 (요약문)
본 연구는 KOSPI 지수의 월별 수익률 예측에서 시변계수를 고려하여 롤링 윈도우방식으로 반복적으로 추정한 최소자승법(OLS)과 머신러닝 기법의 성과를 비교하여, 각 모형의 예측 성능을 평가하고자 하였다. 주요 머신러닝 모형으로는 랜덤포레스트, XGBoost를 선정하였으며, 각 모형의 예측 성과는 평균 제곱 오차(RMSE), 평균 절대 오차(MAE), 방향성 일치 비율, 누적 수익률을 기준으로 평가되었다. 실증 분석 결과, 롤링 OLS 모형은 코스피 지수의 방향성을 예측하는 정확도(64.18%)와 누적 수익률(80.54%) 측면에서 우수한 성과를 보였으며, 이는 경제적 이벤트에 따른 계수 변화를 반영함으로써 시간에 따른 동적 변화성을 포착할 수 있었기 때문으로 해석된다. 반면, 랜덤포레스트 와 XGBoost와 같은 비선형 머신러닝 모형은 방향성 예측이나 누적 수익률에서 다소 제한적인 성과를 보였다. 이러한 결과는 제한적 데이터와 저빈도 금융 데이터에서 전통적인 통계 모형이 오히려 머신러닝 모형보다 유리할 수 있음을 시사하며, 특히 시간에 따라 계수가 변동하는 롤링 OLS의 유용성을 강조한다. 본 연구는 한국 주식 시장에서의 예측 성과를 높이기 위한 대안적 접근으로써 전통적 회귀 모형의 재평가 가능성을 제시한다.
more목차
1. 서론 1
2. 선행연구 2
3. 데이터 4
4. 본론 8
4.1. 표본 내 추정 10
4.1.1. 랜덤포레스트 10
4.1.2. XGBoost 12
4.1.3. 선형 모형 14
4.2. 표본 외 추정 16
4.3. 전체 표본 분석 24
5. 결론 28
참고문헌 30