Many-to-Many 방식을 적용한 미래의 주식 가격 예측에 관한 연구
A Study on Future Stock Price Prediction using Many-to-Many Deep Learning Architecture
- 주제어 (키워드) 주식 가격 예측 , Many-to-Many , WaveNet , Attention , Seq2Seq , LSTM , RNN , Stock Price Prediction , Many-to-Many , WaveNet , Attention , Seq2Seq , LSTM , RNN
- 발행기관 서강대학교 정보통신대학원
- 지도교수 소정민
- 발행년도 2023
- 학위수여년월 2023. 2
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000069814
- UCI I804:11029-000000069814
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
개인투자자의 경우, 신규투자자와 소액투자자일수록 거래 빈도가 높은 반면(평균 3.4일 ~ 5.9일), 주식투자에서 좋은 성과를 내는 것은 어려워, 시장수익률을 하회하는 성과를 내고 있고, 특히 신규투자자의 60%가 손실을 보았다고 한다. 이런 손실은 주식 차트를 보며 감정에 기반한 거래로 이어지는 투자행태에 기인하는 것으로, 개인투자자의 투자행태를 개선하고 성과를 높이기 위해서는 투자자의 감정에 의존한 방식이 아닌 데이터에 기반한 투자 방안이 중요하다고 하겠다. 개인투자자의 거래빈도 행태를 고려하여 미래 어느 날의 주식가격이나 등락을 미리 예측할 수 있다면 위의 문제를 해결하는 데 도움이 될 것이다. 본 연구에서는 위 문제 해결을 위해, 기존 금융 데이터 예측 관련으로 딥러닝 분석에서 많이 활용되어 온 RNN, LSTM 뿐만 아니라, 최근의 시계열 데이터 분석 연구 동향을 반영하여 Seq2Seq, Attention기법, WaveNet 등의 다양한 모델을 추가하고, 예측 모델의 아키텍처 구성시에 시계열 데이터 입력과 출력 관련으로, 기존에 많이 적용되어온 Many-to-One 방식 이외에 Many-to-Many 방식을 적용하여 비교 분석하였다. 또한 기존의 연구에서 많이 적용되어 왔던 Regression 방식의 접근 이외에도, Classification 방식의 접근 및 모의 투자를 포함한 접근을 통해 어떤 딥러닝 모델이 미래의 어느 날의 주식 가격 예측에 더 효과적인지 계량화 된 평가를 통하여, 모델 간의 예측 성능에 대한 비교 분석을 진행하였다. 직접 비교 가능한 모델인 RNN, LSTM을 기준으로 비교를 하면, LSTM 모델의 경우 Many-to-One 방식에 비해 Many-to-Many 방식으로 전환시에 더 우수한 예측성능을 내는 것으로 분석되었다. 각 계량 지표별 Many-to-One 방식의 접근 모델 중 가장 좋은 예측 성능을 내는 모델을 기준으로 95% 신뢰구간을 적용해 우수모델을 선정 하여 예측 성능을 분석해 보면, Regression 방식에서의 예측 성능의 경우 WaveNet, Ensemble, Attention 계열(Bahdanau Attention, Self Attention) 및 LSTM 모델이 우수한 것으로 분석되었고, Classification 방식에서의 예측 성능의 경우 Ensemble, LSTM 모델이 우수한 것으로 분석되었다. 특히, Classification 방식의 예측 결과를 Policy로 하여 모의 주식 투자를 수행한 결과, Ensemble 모델이 분석 종목과 무관하게 가장 좋은 성능을 보였고 Random 전략 대비 높은 수익률을 보여 실생활 적용 가능성을 보여 주는 의미 있는 결과를 얻었다.
more초록 (요약문)
In the case of individual investors, the trading frequency of new investors and small investors is high (3.4 to 5.9 days on average), but it is difficult for individual investors to achieve good results in domestic stock market, recording below average returns. It was known that 60% of new investors suffered losses. These losses are due to the investment behavior of looking at stock charts and buying and selling based on emotion. Therefore, I think it is important to make an investment plan based on data analysis. If individual investors can predict the stock price or volatility of a specific future date by considering their trading frequency, it will help to solve the above problems. In order to solve the above problems, in this study, various time series data analysis models such as Seq2Seq, Attention, and WaveNet were added in addition to RNN and LSTM, which are widely used for deep learning analysis related to sequential data. In this study, in order to build the architecture of various deep learning prediction models in relation to time series data input and output, the Many-to-Many architecture was newly used along with the Many-to-One architecture widely applied in previous studies. In addition to the regression method, which was widely applied in previous studies, a classification method and an method including mock stock investment were added. And I compared and analyzed the prediction performance of the models through quantitative metrics that can show which deep learning model is more effective in predicting future stock prices. When comparing based on RNN and LSTM, which are directly comparable models, it was analyzed that the LSTM model produced better predictive performance in the Many-to-Many architecture than in the Many-to-One architecture. For each quantitative metrics, if excellent models are selected by applying a 95% confidence interval based on the model with the best predictive performance among the Many-to-One architecture models, in the case of predictive performance analysis of the regression method, WaveNet, Ensemble, Attention (Bahdanau Attention, Self-Attention), and LSTM models were analyzed to be excellent. And in the case of predictive performance analysis of classification methods, Ensemble and LSTM models were analyzed to be excellent. As a result of mock stock investment using the prediction result of the classification method as a policy, the ensemble model showed the best results by showing a higher rate of return than the random strategy regardless of the stocks. Through this study, a meaningful conclusion could be drawn that the classification prediction results of the ensemble model composed of Many-to-Many architecture models can be applied to real life.
more