검색 상세

강화학습을 이용한 결측값 대치 알고리즘 : Reinforcement Learning based Missing Value Imputation Algorithm

배윤민 (서강대학교 일반대학원)

원문보기

초록/요약moremore
최근 방대한 데이터와 컴퓨터 성능의 향상으로 빅 데이터, 인공지능 등 새로운 개념이 도입되며, 다양한 산업군의 데이터들이 알고리즘 적용 및 통계적 분석을 통해 각각의 목적에 맞게 사용되고 있다. 하지만 많은 수의 데이터들은 결측 값을 가지고 있고, 이러한 경우에 제대로 된 분석이 어려워 정확한 통계치와 모델링이 불가능하게 된다. 이러한 문제로 다양한 결측치 처리 방법들이 활발히 연구 중이다. 대표적으로 결측값을 제거하고 사용하거나 평균값, 최빈값, 그리고 중앙값 등으로 대체하는 통계 방법과 기계학습 방법인 k-최근 이웃 탐색을 활용...
최근 방대한 데이터와 컴퓨터 성능의 향상으로 빅 데이터, 인공지능 등 새로운 개념이 도입되며, 다양한 산업군의 데이터들이 알고리즘 적용 및 통계적 분석을 통해 각각의 목적에 맞게 사용되고 있다. 하지만 많은 수의 데이터들은 결측 값을 가지고 있고, 이러한 경우에 제대로 된 분석이 어려워 정확한 통계치와 모델링이 불가능하게 된다. 이러한 문제로 다양한 결측치 처리 방법들이 활발히 연구 중이다. 대표적으로 결측값을 제거하고 사용하거나 평균값, 최빈값, 그리고 중앙값 등으로 대체하는 통계 방법과 기계학습 방법인 k-최근 이웃 탐색을 활용한 결측치 대체 방법들이 자주 활용된다. 하지만 이러한 방법들은 한 속성의 값이 대부분 결측되어 있는 경우 사용되기 어려우며, 속성과 속성사이의 상관관계 또는 데이터의 특성을 무시하고 대체되기 때문에 적절하지 못한 값으로 대체 될 수 있다는 문제가 있다. 본 논문에서는 결측치에 알맞은 대치 값을 찾기 위해 강화학습 (Reinforcement Learning)을 사용하는 기법을 제안한다. 본 연구에서 제안하는 알고리즘은 다음과 같다. 컨트롤러는 결측치의 대치값을 산출하도록 설계되고, 해당 산출값을 대치값으로 적용하여 Child 모델에 넣어 성능을 평가한다. Child 모델의 정확도를 기반으로 보상값을 계산하여 Actor-Critic 알고리즘을 통해 Child 모델의 정확도를 높이는 방향으로 대치값 생성 에이전트를 학습시켜 더 알맞은 대치값을 찾도록 한다. 제안한 강화학습 모델을 통해 얻은 성능과 기존의 결측치 처리 방법들과 성능 비교를 통해 제안한 기법이 더 나은 성능을 보이는 것을 확인하였다.
초록/요약moremore
Recently, new concepts such as big data and artificial intelligence are introduced due to huge data and improved computer performance. Data of various industries are used for each purpose through algorithm application and statistical analysis. However, a large number of data have missing values, and...
Recently, new concepts such as big data and artificial intelligence are introduced due to huge data and improved computer performance. Data of various industries are used for each purpose through algorithm application and statistical analysis. However, a large number of data have missing values, and in this case, proper analysis is difficult and accurate statistics and modeling are impossible. Due to this problem, various methods for treating missing values ​​are being actively studied. Typically, statistical methods of removing ​​or replacing them with mean, mode, and median, and missing-value replacement methods using k-near neighbor search, a machine learning method, are frequently used. However, these methods are difficult to be used when the value of one property is mostly missing, and may be replaced by an inappropriate value because it ignores the correlation or property of data. In this paper, we propose a technique that uses reinforcement learning to find substitutes for missing values. The algorithm proposed in this study is as follows. The controller is designed to calculate the substitute value of the missing value, and apply the calculated value as the substitute value to the child model to evaluate the performance. Compensation values ​​are calculated based on the accuracy of the child model, and the substitution value generation agent is trained to increase the accuracy of the child model through the Actor-Critic algorithm. The performance of the proposed reinforcement learning model is compared with that of existing missing data processing methods, and the proposed method shows better performance.