머신러닝을 이용한 게임물 등급분류 및 SHAP을 통한 모델 해석
Game Rating Classification Using Machine Learning and Model Interpretation with SHAP
- 주제어 (키워드) 게임 , 자체등급분류제도 , 머신러닝 , XAI , SHAP , Game , Independent Rating Classification , Machine Learning , XAI , SHAP
- 발행기관 서강대학교 정보통신대학원
- 지도교수 김세준
- 발행년도 2022
- 학위수여년월 2022. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000066979
- UCI I804:11029-000000066979
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록
본 연구의 목적은 머신러닝 기법을 이용한 게임물 등급분류 모델을 개발하여 현행 등급분류 체계가 가지는 한계점을 개선하는 방안을 제안하고 등급 결정에 영향을 미친 요인에 대해 검토하는 것이다. 이를 위해 자체등급분류사업자를 통해 등급분류된 13,437개의 데이터를 활용하여 머신러닝 모델을 구축하고 모델별 성능을 비교하였다. 가장 좋은 성능을 보인 모델에 XAI 기법 중 하나인 SHAP을 적용하여 등급 결정에 영향을 미친 요인에 대해 검토하였다. 그 결과 다층 신경망 모델의 성능이 가장 좋은 것으로 나타났으며 등급 결정에 가장 큰 영향을 미친 피처로는 ‘드문 경미한 만화 또는 비현실적 폭력’이 확인되었다. 나아가 현재는 등급분류 기준이 아닌 ‘상호작용 요인’이 등급분류 결정에 미치는 영향력을 확인하기 위하여, ‘상호작용 요인’ 추가하여 모델을 다시 구축하고 모델별 성능 비교를 통해 가장 성능이 좋은 모델에 SHAP을 적용하였다. 상호작용 요인을 포함하여 구축한 모델별 결과에서도 다층 신경망 모델의 성능이 가장 좋은 것으로 나타났으며 상호작용 요인과 관련해서는 ‘무제한 웹 액세스’ 피처가 상대적으로 영향력이 큰 것으로 나타났다. 최종적으로 위의 두 결과를 비교함으로써 요인 추가에 따른 영향력을 확인하였다. 본 연구를 통해 확인한 결과는 향후 게임물 등급분류에 관한 규제 개선 및 시스템 향상에 참고가 될 수 있을 것으로 기대된다.
more초록
The purpose of this study is to suggest the best machine learning model that can replace the present system of predicting the age rating for games and examining the factors that affect ratings. The machine learning models were built to learn from the 13,437 samples classified by the Open Market Operator. After comparing the performance of models, we apply SHAP which is one of the XAI methods to examine the factors that affect ratings in order to determine the significance of the factors that impact users. The results show that Multilayer Perceptron achieved best performance and the most influential feature is ‘Infrequent Mild Cartoon or Fantasy Violence’. In addition, we rebuild the models including the ‘Interactive elements’ that are not considered as a criterion for the age rating system in use today and follow the same steps as before. Like the results of the first model, Multilayer Perceptron achieved best performance and in terms of Interactive elements, ‘Unrestricted Web Access’ was found to be a relatively influential feature. Finally, we examine the impact of the ‘Interactive elements’ by comparing the original model to the Interactive elements plus model. Through the above process, we can develop regulations of the game age ratings and system advancements based on the facts found.
more