검색 상세

앙상블 모델 기반의 중심 지역 날씨 예측

Weather Prediction for Central Regions Based on Ensemble Models

초록 (요약문)

기후 변화가 가속화됨에 따라 기상 예측의 중요성이 더욱 부각되고 있다. 기상 예측은 농업, 교통, 에너지 관리와 같은 다양한 분야에 직접적으로 영향을 미치며, 이를 통해 기후 변화의 영향을 분석하고 대응 방안을 마련할 수 있다. 기존 연구들은 주로 특정 지역의 과거 데이터를 바탕으로 해당 지역의 미래 기후를 예측하는 방식에 의존해왔다. 그러나 이상 기후 현상의 증가로 인해 이러한 예측 모델들이 변화하는 기후 패턴을 충분히 반영하지 못하는 한계를 보이고 있다. 본 연구에서는 특정 지역을 중심으로 주변 8방위에서 수집된 기상 데이터를 활용해 기상 예측 모델을 구축하고자 한다. 제안된 방법은 주변 기상 데이터를 통해 중심 지역을 포함한 인접 지역의 기상 변화를 보다 정밀하게 반영할 수 있도록 하며, 앙상블 기법의 모델들을 사용하여 예측 정확도를 높였다. 실험에서는 몬타나 주와 오하이오 주를 중심으로 주변 8개 지역의 데이터를 활용하여 단일 모델(결정 트리, 다층 퍼셉트론)과 앙상블 모델(랜덤 포레스트, 엑스트라 트리, 그라디언트 부스팅, XG부스트, 스태킹, 보팅)의 성능을 비교하였다. 분석 결과, 다층 퍼셉트론과 트리 기반 모델을 결합한 앙상블 기법이 과적합 방지 및 예측 성능 개선에 효과적이었으며, 특히 오하이오 주에서는 엑스트라 트리와 다층 퍼셉트론을 이용한 보팅 모델이, 몬타나 주에서는 랜덤 포레스트, 엑스트라 트리, 다층 퍼셉트론을 결합한 스태킹 모델이 최적의 성능을 보였다. 본 연구의 결과는 기후 예측의 정확도를 높일 뿐만 아니라, 연산 효율성 개선을 통해 실시간 기상 예측, 재난 방지 및 효율적인 기상 모니터링 시스템 구축에 유용하게 활용될 수 있을 것으로 기대된다.

more

초록 (요약문)

As climate change accelerates, the importance of weather forecasting is becoming more prominent. Weather forecasting has a direct impact on various fields, such as agriculture, transportation, and energy management, allowing for analysis of the effects of climate change and the preparation of countermeasures. Existing studies have primarily relied on predicting future weather in specific areas based on past data from those areas. However, with the increase in abnormal weather phenomena, these predictive models have shown limitations in adequately reflecting changing climate patterns. This thesis aims to construct a weather forecasting model for a specific region by utilizing meteorological data collected from eight surrounding directions. The proposed method enhances the precision of weather predictions for both the central and adjacent areas by incorporating surrounding meteorological data. Additionally, ensemble techniques are employed to improve forecasting accuracy. In experiments, data from eight surrounding regions centered on Montana and Ohio were used to compare the performance of individual models (decision trees, multi-layer perceptron) and ensemble models (random forest, extra trees, gradient boosting, XGBoost, stacking, and voting). The analysis found that ensemble methods combining multi-layer perceptron with tree-based models were effective in preventing overfitting and improving predictive performance. In particular, the voting model using extra trees and multi-layer perceptron showed optimal performance in Ohio, while the stacking model combining random forest, extra trees, and multi-layer perceptron performed best in Montana. The results of this thesis are expected to not only increase the accuracy of climate predictions but also be useful for real-time weather forecasting, disaster prevention, and the establishment of efficient weather monitoring systems by improving computational efficiency.

more

목차

제 1 장 서론 7
제 2 장 연구배경 9
2.1 의사 결정 나무(DECISION TREE) 9
2.2 다층 퍼셉트론(MULTI-LAYER PERCEPTRON) 13
2.3 랜덤 포레스트(RANDOM FOREST) 17
2.3.1 Out of Bag 19
2.3.2 변수 중요도(Variable Importance) 20
2.4 엑스트라 트리(EXTRA TREE) 21
2.5 그라디언트 부스팅(GRADIENT BOOSTING) 23
2.5.1 데이터 학습 24
2.5.2 정규화 26
2.6 XG부스트(EXTREME GRADIENT BOOSTING) 28
2.6.1 XG부스트의 트리 구조 선택 29
2.6.2 노드 분할 알고리즘 31
제 3 장 기존 연구 33
3.1 단일 도시 데이터를 활용한 기상 예측 33
3.2 인접 도시 데이터를 활용한 기상 예측 36
3.3 기존 연구들의 한계점 39
제 4 장 기상 예측을 위한 데이터 수집 및 전 처리와 앙상블 모델 설계 41
4.1 주변 지역과 중심 지역의 데이터 수집 및 전 처리 41
4.1.1 기상 예측 목표 지역과 주변 지역 선정 41
4.1.2 API를 통한 기상 데이터 수집 및 전 처리 44
4.2 기상 예측을 위한 앙상블 모델 제안 46
제 5 장 실험 49
5.1 실험 환경 49
5.2 K-FOLD 교차 검증(CROSS VALIDATION) 49
5.3 평가 지표 50
5.4 기상 예측 결과 52
5.4.1 단일 모델 기상 예측 결과 52
5.4.2 앙상블 기법을 사용한 기상 예측 결과 57
제 6 장 결론 78
참고 문헌 81

more