검색 상세

인사관리효율화를 위한 기계학습 기반의 퇴직 예측

Retirement prediction for efficiency of HR management based on machine learning

초록 (요약문)

과거의 인적자원 관리는 생산성 유지 및 향상을 위한 단순 노동력 관리의 개념이었다. 반면 오늘날의 인적자원 관리는 각 구성원을 기업이나 조직의 자원으로 인식하고, 이들의 능력을 전략적으로 육성하고 활용하는 측면에 중점을 두고 있다. 이에 따라 퇴사자의 발생은 자원의 손실로 인식되어 기업들은 인재들의 퇴직을 방지하기 위해 다양한 노력을 기울이고 있다. 이와 같은 상황에서 기업에서 퇴직의사가 있는 직원들을 선별할 수 있다면 퇴직을 방지하기위한 정책을 수립하거나 선별적 혜택을 제공함으로써 퇴직발생으로 인한 자원의 손실 혹은 이로 인한 직, 간접적인 비용의 발생을 방지할 수 있을 것이다. 본 연구에서는 인적사항 및 현재 근무 중인 회사와 연관되는 다양한 인사 데이터 중 퇴직 여부를 예측할 수 있는 변수를 선별해낸 후, 퇴직 예정자를 예측할 수 있는 기계학습 방법론 기반의 모델을 제안하고자 한다. 구체적으로는 데이터의 불균형 문제를 해결하기 위해 Oversampling 기법을 적용한 후 변수 선별을 위하여 Pearson correlation coefficient와 Logistic regression을 활용한 통계적 분석을 수행한다. 이후, 확정된 변수에 대해 앙상블 기반의 기계학습 방법론인 Random forest를 이용하여 퇴직자 예측모델을 구축하여 퇴직여부를 예측한다. 본 모델의 검증을 위해 “2019년 대졸자 직업이동 경로조사(2018GOMS)” 데이터를 사례연구로 활용하였다. 제안한 방법론의 성능평가를 위해 5가지의 기계학습 방법론을 이용하여 성능을 비교하였다. 결론적으로 본 연구에서 제안한 모델을 따른 분류모델이 가장 높은 성능을 보였다. 본 연구는 국내 데이터를 바탕으로 퇴직여부를 예측할 수 있는 방법론을 제시한다는 점, 기존 연구에서 사용한 기계학습 방법론 이외의 기계학습 방법론을 적용하여 좀 더 정교한 모델을 구축하였음에 의의가 있다.

more

초록 (요약문)

In the past, human resource management was the concept of simple labor management to maintain and improve productivity. On the other hand, today's human resource management focuses on the aspect of recognizing each member as a resource of a company or organization, and strategically nurturing and utilizing their capabilities. Accordingly, the occurrence of resignation is recognized as a loss of resources, and companies are making various efforts to prevent the retirement of talented people. In such a situation, if a company can discern potential retirees, it can establish a policy to prevent retirement or provide selective benefits to prevent loss of resources or indirect costs resulting from retirement. This study suggests a new model based on a machine learning model, which predicts retirees by determining significant variables out of personal information as well as personnel data of the firm the potential retirees currently work for. Specifically, after applying the oversampling technique to solve the problem of data imbalance, statistical analysis using Pearson correlation coefficient and logistic regression is performed to select variables. Thereafter, for the determined variables, a retirement prediction model is built using a random forest, an ensemble-based machine learning methodology, to predict whether or not they will retire. For the verification of this model, the data of “2019 University Graduates’ Vocational Migration Path Survey (2018GOMS)” was used as a case study. For performance evaluation of the proposed model, the model performance was compared using five different machine learning methodologies. In conclusion, the classification model based on the model proposed in this study showed the highest performance. This study is meaningful in that it presents a model that can predict retirement based on domestic data; furthermore, the oversampling technique, which has not been used in the previous studies, implemented a more sophisticated model when used with machine learning methodologies.

more