검색 상세

미세먼지 농도 예측을 위한 통계 및 심층신경망 예측 기법 비교 연구

초록/요약

최근 중국에서 날아오는 황사에 미세먼지까지 더해져 한반도의 하늘은 뿌옇게 흐린 날이 잦았다. 미세먼지의 유해성이 널리 알려지면서 미세먼지 예보의 정확도 개선은 국가적으로 해결해야 할 사회 문제가 되었다. 우리나라의 미세먼지 오염도는 2000년 이후 지속적으로 개선되는 추세였으나, 2013년부터는 정체되었고, 국민들이 실생활에서 체감하는 오염도는 오히려 높아지는 상황이다. 그리고 현재 국내외로 미세먼지 예보 모델의 정확도 개선에 대한 연구와 투자가 집중함에 따라 미세먼지는 전세계적으로 관심을 받고 있는 상황이다. 본 논문은 최근 다양한 분야에서 우수한 성능을 보이고 있는 심층 신경망(Deep Neural Network)을 미세먼지 농도 예측에 적용하여 성능을 평가하는 것을 목적으로 한다. 심층 신경망 외에도 로지스틱 회귀(Logistic Regression), 서포트 백터 머신(Support Vector Machine)의 알고리즘을 사용하여 성능을 비교 평가 하였다. 실험 데이터는 서울시에서 운영하는 서울 열린 데이터 광장 포털(http://data.seoul.go.kr)의 기상정보와 대기오염정보를 이용하여 총 50,000건의 데이터를 수집하여 구성하였다. 실험은 정규화한 데이터를 Train Data 40,000건과 Test Data 10,000건으로 구분하여 진행하였다. 최종 성능 비교 분석 결과는 로지스틱 회귀 54.28%, 서포트 백터 머신 75.10%, 심층 신경망 77.48%로, 심층 신경망이 로지스틱 회귀 보다는 23.20%, 서포트 백터 머신 보다는 2.38% 높은 성능을 보였다.

more

초록/요약

Recently, the sky of the Korean Peninsula is hazy with fine dust and yellow dust from China. As maleficence of the fine dust are getting focused, improvement of fine dust forecast accuracy has become a national social issue. In Korean Peninsula, the degree of fine dust had sustainedly degraded before 2000, but has been stagnant since 2013. Moreover, the degree of fine dust that people actually feel is being elevated. The fine dust now is an international issue now that many nations conduct researches and invest in improvement of fine dust forecast models. The Deep Neural Network recently shows good performance in various fields and the purpose of this paper is to measure the performance of the DNN when applied to forecast of fine dust. The performance of Logistic Regression and Support Vector Machine are measured as well in order to compare the DNN to them. 50,000 of weather and air pollution data are collected from the Seoul City Portal(http://data.seoul.go.kr) to be used in the experiment and normalized data are divided into 40,000 of Train Data and 10,000 of Test Data. In the final analysis of the performances, Logistic Regression shows 54.28%, Support Vector Machine shows 75.10% and DNN shows 77.48%. The Deep Neutral Network shows 23.20% better performance than Logistic Regression and 2.38% better performance than Support Vector Machine.

more