차트 이미지 시각적 분석을 통한 주가 예측
Stock Price Prediction Through Visual Analysis of Chart Images
- 주제어 (키워드) 딥러닝 , 컴퓨터 비전 , 주가 예측 , 설명 가능한 인공지능 , 이미지 분류; Deep Learning , Computer Vision , Stock Price Prediction , Explainable Artificial Intelligence , Image Classification
- 발행기관 서강대학교 정보통신대학원
- 지도교수 최준석
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000078923
- UCI I804:11029-000000078923
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
본 연구는 주식을 거래하는 트레이더의 시각적 패턴 분석과 시장 기회 포착방법을 컴퓨터 비전 기술로 모방할 수 있는지에 대한 의문에서 시작되었다. 이를 위해 딥러닝 기반 컴퓨터 비전 기술을 활용하여 주식 시장 차트 이미지에서 미래 주가를 예측하고 설명 가능한 인공지능(XAI) 기법을 통해 이 예측 과정을 해석하는 것을 목적으로 한다. 연구 방법론으로는 시계열 분석 모델(DeepAR)과 딥러닝 기반 차트 이미지 분류 모델(CNN, ResNet, ViT 등)을 사용하여 주가 상승을 예측하고 성능을 비교했다. 실험 설계는 다음과 같다. 첫째, 2005년부터 2023년까지의 주가 데이터를 수집하고 캔들스틱 차트 및 이동 평균선을 포함한 차트이미지를 생성하였다. 둘째, 다음 거래일의 단순 상승과 1.5% 이상의 상승이라는 두 가지 주가 상승 예측 레이블을 생성하여 모델을 학습 및 평가하고 LIME 기법을 활용하여 모델의 예측 결과를 해석하였다. 마지막으로 Confusion Matrix와 백테스팅을 통해 모델 성능을 평가하였다. 모델 평가 결과, 종합적으로 단순 상승을 예측하는 ViT 모델이 가장 균형 잡힌 성능을 보였다. 백테스팅 결과에서도 ViT 모델은 단순 상승 예측에서 평균 수익률이 328.29%에 달했으며 수익률 표준편차는 482.83%로 나타나 가장 높은 변동성을 보였다. 하락 기간 중에는 모델의 평균 수익률이 마이너스를 기록했으나 딥러닝 모델과 전략을 적절히 활용한 경우에는 수익을 창출할 수 있었다. 본 연구의 주요 기여는 다음과 같다. 첫째, 차트 이미지 분류 모델이 시각적인 요소만으로도 주가를 예측할 수 있음을 입증하였다. 이는 기존의 시계열 분석과는 다른 접근 방식으로 시각적 데이터를 활용한 주가 예측의 정확성을 향상시킬 수 있음을 보여준다. 둘째, 두 가지 주가 상승 예측 레이블을 통해 효과적인 레이블링 방법을 제안한다. 셋째, 나스닥 종합 지수, S&P500, Magnificent 7과 같이 대표성 있는 주식 종목을 사용함으로써 연구 결과의 일반화 가능성과 실제 시장에 대한 적용력을 높였다. 마지막으로 백테스팅 결과를 통해 대조군 대비 모델이 실제 시장 조건에서 우수한 성능을 발휘함을 확인했다.
more초록 (요약문)
This paper begins with the inquiry into whether the visual pattern analysis and market opportunity identification methods used by stock traders can be emulated using computer vision technology. The objective is to predict future stock prices from stock market chart images using deep learning-based computer vision techniques, and to interpret this prediction process through Explainable Artificial Intelligence (XAI) methods. The research methodology employs time-series analysis models (DeepAR) and deep learning-based chart image classification models (CNN, ResNet, ViT, etc.) to predict stock price increases and compare performances. The experimental design is as follows. First, stock price data from 2005 to 2023 were collected, and chart images including candlestick charts and moving averages were generated. Second, two stock price increase prediction labels, simple increase and increase of more than 1.5%, were created to train and evaluate the models, and the LIME technique was used to interpret the results of the model predictions. Finally, model performance was assessed using a Confusion Matrix and backtesting. Overall, the ViT model showed the most balanced performance in predicting simple increases. In backtesting results, the ViT model also demonstrated the highest variability with an average return of 328.29% and a standard deviation of returns at 482.83%. Although the model recorded negative average returns during downturns, it was able to generate profits when deep learning models and strategies were appropriately utilized. The main contributions of this paper are as follows. First, it was proven that chart image classification models can predict stock prices using only visual elements, which presents a different approach from traditional time-series analysis and can improve the accuracy of stock price predictions using visual data. Second, an effective labeling method through two types of stock price increase prediction labels is proposed. Third, the use of representative stock indices such as NASDAQ, S&P 500, and Magnificent 7 enhances the generalizability of the research findings and their applicability to real markets. Lastly, the backtesting results confirm that compared to the control group, the model performs excellently under actual market conditions.
more목차
제 1 장 서론 1
제 1 절 연구 배경 및 목적 1
제 2 절 연구 범위 및 구성 2
제 2 장 관련 연구 3
제 1 절 금융시장 주가 예측 모델의 발전 3
(1) 기존의 주가 예측 이론과 모델 3
(2) 시계열 예측 모델 5
(3) 이미지 기반 딥러닝 모델의 적용 6
(4) 기존연구 차별점과 본 연구의 기여 6
제 2 절 주가 예측 모델 8
(1) 시계열 딥러닝 모델(DeepAR) 8
(2) 차트 이미지 분류 모델 9
제 3 절 Local Interpretable Model-agnostic Explantaion(LIME) 19
제 3 장 연구 방법론 22
제 1 절 연구 개요 22
(1) 데이터 수집 및 생성 22
(2) 레이블 생성 22
(3) 시계열 딥러닝 모델(DeepAR) 22
(4) 차트 이미지 분류 모델 22
(5) Local Interpretable Model-agnostic Explanation(LIME) 23
(6) 모델 평가 방법 23
제 2 절 데이터 생성 24
(1) 데이터 수집 24
(2) 데이터 전처리 및 차트 생성 25
(3) 레이블 생성 26
제 3 절 시계열 딥러닝모델(DeepAR) 27
제 4 절 차트 이미지 분류 모델 28
(1) 컨볼루션 신경망(Convolutional Neural Networks) 28
(2) ResNet(Residual neural network) 29
(3) ViT(Vision Transformer) 모델 30
제 5 절 Local Interpretable Model-agnostic Explanation(LIME) 31
제 6 절 모델 평가 방법 32
(1) Confusion Matrix 32
(2) 백테스팅 33
제 4 장 모델 평가 및 백테스팅 결과 35
제 1 절 모델 평가 결과 35
제 2 절 백테스팅 결과 36
제 3 절 LIME을 활용한 모델 해석 44
제 5 장 결론 46
참고 문헌 47