검색 상세

다중 시간 세분성을 통한 계층적 요약 전처리를 이용한 효과적인 시계열 예측방법

Effective Time Series Forecasting Method Using Hierarchical Summary Preprocessing with Multiple Temporal Granularity

초록

시계열 예측은 기업이나 현장에서 의사결정의 보조자 역할을 하므로 매우 중요한 과제이다. 컴퓨팅 파워가 증가하면서 시계열 예측 분야에서 기계 학습모델이 주요모델이 되고, 시계열 예측을 위한 딥러닝 모델들이 계속해서 연구되고 있다. 딥러닝 모델에서 시간 정보를 잘 포착하기 위해 긴 길이의 Look-back window 즉, 과거 데이터가 필요하지만, Look-back window의 길이를 증가시킬수록 훈련시간과 GPU, 메모리와 같은 사용자원도 함께 증가해 Look-back window의 길이를 늘이는 데 한계가 있다. 본 논문에서는 이 문제를 해결하기 위해 요약 전처리를 활용한 효과적인 시계열 예측방법을 제안한다. 훈련 데이터를 1개 이상의 집계구간을 가진 집계함수로 요약하고 데이터 셋의 특성에 따라 요약 데이터와 상세 데이터를 결합하는 계층적 요약 전처리를 적용한다. 이렇게 구성된 Look-back window를 트랜스포머 기반의 시계열 예측모델을 사용하여 시계열 예측을 수행한 결과 전처리를 사용하지 않은 모델 대비 성능이 최대 27% 증가하고 훈련시간은 평균 77% 감소하였다.

more

초록

Time series prediction is a very important task because it assists the decision making-process. As computing power increases, machine learning models become major models in time series prediction. And deep learning models for time series prediction have been extensively studied. In the deep learning model, a longer look-back window is required to capture time information well. But as the length of the look-back window increases, resources such as training time, GPU, and memory also increase. Therefore there is a limit to increasing the length of the look-back window. To solve this problem, we propose an effective time series prediction method using summary pre-processing. We summarize training data into an aggregation with at least one aggregation interval and apply hierarchical summary pre-processing that combines summary data and detailed data according to the characteristics of the data set. We predict the time series using transformer based model with the constructed look-back window. As the result, performance increased by up to 27% compared to the model without pre-processing and training time decreased by 77% on average.

more

목차

1. 서론 1
2. 관련연구 3
2.1 RNN 5
2.2 MLP 6
2.3 트랜스포머 7
3. 계층적 요약 전처리를 활용한 효과적인 시계열 예측 방법 9
3.1 시간 세분성을 통한 계층적 요약 전처리 9
3.1.1 집계함수를 이용한 요약 데이터 생성 9
3.1.2 계층적 요약 전처리를 활용한 Look-back window 생성 12
3.2 트랜스포머 기반의 시계열 예측 16
4. 실험 및 성능평가 19
4.1 실험데이터 19
4.2 실험환경 20
4.3 성능 비교 21
4.3.1 전처리에 따른 파라미터 별 성능비교 21
4.3.1.1 집계함수 별 성능비교 21
4.3.1.2 집계구간 별 성능비교 22
4.3.1.3 집계비율 별 성능비교 24
4.3.1.4 전처리 기법 별 성능비교 26
4.3.2 BaseLine 모델과 성능비교 28
4.3.3 기존모델과 성능비교 31
5. 결론 33
참고문헌 34

more