딥러닝 기반 미세먼지 농도 예측 기법 성능 연구
Performance Study on the Prediction Method of Fine dust Concentration based on Deep Learning
- 주제(키워드) CNN-LSTM , 미세먼지 , 딥러닝
- 발행기관 서강대학교 정보통신대학원
- 지도교수 양지훈
- 발행년도 2018
- 학위수여년월 2018. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 정보보호
- 실제URI http://www.dcollection.net/handler/sogang/000000063558
- UCI I804:11029-000000063558
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
계속되는 흐린 하늘로 미세먼지에 대한 우려가 증가하고 있다. 해결의 한 부분으로 미세먼지 예보 역할은 더욱더 중요해지고 있기에, 미세먼지 농도 예측 모델의 정확도 향상을 위한 연구는 반드시 필요하다. 본 논문에서는 Stacked LSTM과 CNN(Convolution Neural Network)을 합친 복합 모델인 CNN-LSTM으로 미세먼지 예측 정확도 향상을 목표로 연구했다. 그리고 Stacked LSTM 외 RNN(Recurrent Neural Network) LSTM, 심층 신경망 (Deep Neural Network), 로지스틱 회귀(Logistic Regression), 선형 회귀(Linear Regression)를 이용해 예측 기법 성능 연구를 했다. 또한 미세먼지에 직접, 간접적으로 영향을 미치는 인자들의 상관관계를 바탕으로 Input을 선정했다. 실험에 사용한 데이터는 2010년 1월부터 2017년 12월의 데이터 총 72,789건으로, 미세먼지 농도 예측에 적합하도록 데이터를 NaN(Not a Number)과 이상치 제거 및 다중공선성 (Multicollinearity)을 고려해 데이터를 선별했다. 또한 평균을 이용한 정규화 처리와 One Hot Encoding 후 Training Data 63,664 건과 Test Data 9,125건으로 분리해 연구했다. 연구 결과 CNN-LSTM이 78.79%로 가장 정확도가 높았다. 또한 본 논문의 예측 기법 성능 연구 결과는 선형 회귀 68.36%, 로지스틱 회귀 71.13%, 심층 신경망 72.85%, RNN LSTM 73.51%, Stacked LSTM 77.13%로 CNN-LSTM 모델이 가장 우수하였다.
more