머신러닝과 패널고정효과를 활용한 아파트 실거래가 예측 비교
Predicting Actual Transaction apartment Price Using Machine Learning Methods and Fixed Effects Model
- 주제(키워드) 머신러닝 , 랜덤 포레스트 , MARS , 패널고정효과 , 아파트 실거래가 , Machine Learning , Random Forest , MARS , Fixed Effect , Actual Transaction Apartment Price
- 발행기관 서강대학교 일반대학원
- 지도교수 이윤수
- 발행년도 2021
- 학위수여년월 2021. 2
- 학위명 석사
- 학과 및 전공 일반대학원 경제학과
- UCI I804:11029-000000065826
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
정확한 주택가격 예측은 주택 구매를 희망하는 사람과 주택 소유자뿐만 아니라 금융기관, 정부 등 모든 부동산 시장 참여자에게 매우 중요한 문제이다. 본 연구는 마이크로데이터를 활용한 주택가격 예측 분석 모형의 성과를 평가하기 위해, 머신러닝 기법과 패널고정효과의 예측력을 비교하였다. 본 연구는 아파트 단지 단위의 패널 자료를 이용하여 거시경제변수와 정책변수 뿐만 아니라 기존 시계열 모형에서 고려하지 못한 주택의 특성을 예측에 활용한다. 2006년 1월부터 2020년 7월까지 서울시의 아파트 실거래가를 이용하여 아파트 단지 단위에서 분석한 결과 머신러닝 기법이 패널고정효과모형보다 더 우수한 예측력을 나타냈으며, 특히 머신러닝 기법 중 랜덤 포레스트 모형이 다변량 가법 회귀 스플라인(MARS) 모형보다 높은 예측 정확성을 나타내는 것으로 분석되었다. 주택가격 예측 분야에서 마이크로데이터를 이용하여 머신러닝의 활용 가능성을 확인하였으며, 앞으로 더 많은 데이터가 축적 및 학습되면 추정 예측력이 더욱 높아질 것으로 기대한다.
more초록/요약
Accurate house price prediction is a critical issue for all real estate market participants, including financial institutions and governments, as well as for those who expect to buy homes and are homeowners. To evaluate the performance of a house price prediction analysis model, this study compares machine learning methods with predictive power of fixed effects model employing actual transaction data from January 2006 to July 2020 in Seoul. For this purpose, we consider the characteristcs of apartment complex units as well as macroeconomic variables and policy variables. We find that Random Forest(RF) model shows higher predictive accuracy than Multivariate Adaptive Regression Splines (MARS) model in machine learning. Our results support the potential of machine leaning method employing microdata on house price prediction and forecasting.
more