검색 상세

다이나믹 타임 워핑(Dynamic Time Warping) 알고리즘을 이용한 COVID-19 기간의 주가 패턴 분석에 관한 연구

A Study on the Analysis of Stock Price Patterns in COVID-19 Period Using Dynamic Time Warping Algorithm

초록/요약

본 연구는 COVID-19 기간과 유사한 과거의 주가폭락 사건을 추출하고, 분석하여 COVID-19으로 발생한 경제적 위기를 극복하기 위한 대응방안을 마련하는데 도움이 되고자 실시하였다. DTW를 이용하여 주가패턴을 추출하고 분석했던 선행연구들처럼, 지난 20년간의 S&P 500 Index 지수의 데이터를 정규화하고, 스팬 별로 분할하여 기간 범위를 설정하며, 슬라이딩 윈도우 기법을 적용하여 DTW 거리를 측정했다. 특히, 5가지 정규화 기법을 각각 다르게 적용하여 결과값을 도출해보았고, 각각의 정규화 방법별로 다르게 도출되는 결과값을 서로 비교·분석해본 내용도 수록하였다. 또한, 두 시계열 데이터 간의 끝점을 연결한 방식과 끝점을 연결하지 않은 방식으로 2가지 DTW 거리를 측정했다. 연구 결과, '2015-08 중국증시 폭락', '2017-08 북·미 갈등', '2019-06 미·중 무역분쟁', '2008-10 글로벌 경제위기', '2019-06 미·중 무역분쟁', '2008-10 글로벌 경제위기'와 같은 과거에 일어난 주가폭락 사건들이 추출되었다. 이번 연구 결과를 통해서 COVID-19 기간과 유사한 주가 패턴을 보이는 사건이 존재함을 확인하였다. 따라서 당시 사건에 대한 투자자들의 대응방안, 정부 정책에 주목하여 COVID-19 위기를 타개할 대안을 벤치마킹(Benchmarking)할 수 있다. 또한, COVID-19이라는 전염병(Epidemic)은 이전에 발생한 전염병인 메르스(MERS, 2015), 사스(SARS, 2003)와는 전혀 다른 양상으로 전개되었다는 점을 확인하였다. 따라서, 적어도 투자관점에서는 과거에 일어났던 전염병 데이터에서 해결책(Solution)을 찾는 것이 어렵다는 것을 확인했다. 특별히, 각각의 정규화 방법별로 추출되는 사건들이 조금씩 다르다는 것을 확인할 수 있었다. 나아가, 데이터 분석 연구에서 정규화가 매우 중요하다는 점을 확인할 수 있었다. 이번 연구에서는 5가지 정규화 방법 중, 최소-최대 정규화 방법이 가장 안정적인 결과를 보였다. 또한, 측정한 2가지 거리 중에서 ‘정규화된 관찰 데이터와 레퍼런스 데이터의 끝점을 연결없이 측정한 DTW 거리’가 더 좋은 결과를 보였다. 마지막으로, 스팬이 커지면 커질수록 ‘정규화된 관찰 데이터와 레퍼런스 데이터의 끝점을 연결없이 측정한 DTW 거리’가 상대적으로 더 좋은 결과를 나타내었다. 향후 보다 발전된 연구를 위해서 관찰 기간 선택이 결과(Performance)에 미치는 영향을 체크해야 한다. 또한, 거리(Distance) 즉, 유사성(Similarity)에 대한 절대적인 기준이 존재하지 않으므로, 이에 대한 객관적이고, 절대적인 기준을 설정할 필요가 있다. 이번 연구에서는 이에 대한 대안으로 추출된 사건의 그래프와 COVID-19 기간의 그래프를 각각 그려보고, 육안으로 비교해보는 작업을 수행하였다. 마지막으로, COVID-19 기간과 유사한 과거의 패턴들을 추출하고 분석하는 연구에서 더 나아가 COVID-19 기간 이후의 전개 양상을 예측해보는 연구도 예측을 위한 방법론을 추가 설계하여 시도해 볼 수 있을 것이다.

more

초록/요약

This study was conducted to extract and analyze past stock price falls similar to the COVID-19 period to help develop countermeasures to overcome the economic crisis caused by COVID-19. Like previous studies that extracted and analyzed stock price patterns using DTW, data from the S&P 500 Index over the past 20 years were normalized, split by span to set a period range, and measured DTW distances by applying sliding window techniques. In particular, the results were derived by applying the five normalization techniques differently, and the comparison and analysis of the results produced differently for each normalization method was included. In addition, we measured two DTW distances in a way that connects the endpoints between two time series data and in a way that does not connect the endpoints. As a result of the study, past stock price falls such as "2015-08 China Stock Price shock", "2017-08 North Korea-U.S.A Conflict", ”2019-06 U.S.A-China Trade Conflict“ and “2008-10 Global Economic Crisis" were extracted. The results of this study confirm that there are events that exhibit stock price patterns similar to the COVID-19 period. Consequently, investors' response to events at the time, and government policies, can be noted to benchmark alternatives that will overcome the COVID-19 crisis. It was also confirmed that the epidemic (COVID-19) developed in a completely different way from the previous outbreaks of MERS (MERS, 2015) and SARS (SARS, 2003). Therefore, at least from an investment perspective, we have identified the difficulty of finding solutions from past epidemic accident data. In particular, it was found that the events extracted for each normalization method were slightly different. Furthermore, the data analysis study showed that normalization was very important. Of the five normalization methods in this work, the Min-Max normalization method showed the most stable results. Furthermore, among the two measured distances, ‘the DTW distance measured without endpoints connection between the normalized observation data and the reference data' showed better results. Finally, the larger the span was , the relatively better result 'the DTW distance measured without endpoints connection between the normalized observation data and the reference data' showed. For more advanced research in the future, the impact of the observation period selection on the results should be checked. Furthermore, there is no absolute criterion for distance, or similarity, so it is necessary to establish an objective and absolute criterion for it. In this work, as a alternative of no absolute criterion, we draw a graph of events extracted and a graph of the COVID-19 period respectively, and compare to each other visually. Finally, further from the study of extracting and analyzing past patterns similar to those of COVID-19 period, the study to predict developments after COVID-19 period can be further tried by designing additional methodologies for prediction.

more