검색 상세

Prediction Model for Metaverse Usage by Implementing Bayesian Inference

베이지안 추론을 이용한 메타버스 이용 예측 모형 연구

초록

This study propose a methodology for building a statistical model to predict Metaverse usage by using the raw data from the <Korea Media Panel Survey>, provided by the Korea Information Society Development Institute. To enhance the predictive performance of the model, we proposed Bayesian Inference based variable selection by using Bayesian Networks. In the process, we compared our proposed oversampling method, generating oversampled data by resampling both majority and minority class, to that of the random oversampling method, then selected superior approach for our train data. For variable selection, we extracted the parent, child, and spouse of the target node in Markov blanket, then confirm the conditional independency of the child nodes by What-If inference to incorporate interaction effect between child and spouse nodes as variables. Ultimately, we proposed Bayesian hierarchical logistic regression model with random oversampled train data. Furthermore, we compared the proposed model with existing machine learning methods to suggest its potential applicability.

more

초록

본 연구는 메타버스 이용 여부를 예측하는 통계적 방법론을 제시하는 것을 목적으로 수행하였으며, 정보통신정책연구원에서 제공하는 2022년 <한국미디어패널조사> 설문을 분석 데이터로 활용하였다. 통계적 모형의 예측 성능을 향상시키기 위해 베이지안 추론에 기반한 변수 선택 및 모형 구축 방법을 새롭게 제안하였으며, 베이지안 네트워크를 학습시켜 마르코프 블랭킷에 해당하는 변수를 선택하고, 추론 과정을 통해 자식 노드의 조건부 독립성에 따른 배우자 노드의 종속성 여부를 파악해 도출한 상호작용 변수를 모형 구축에 활용하였다. 또한, 2022년 국내 메타버스 이용률이 4.2%로 불균형 데이터인 점을 고려해 오버 샘플링을 적용하였다. 이 과정에서 본 연구에서는 다수 클래스의 표본도 함께 재추출하는 새로운 오버 샘플링 방식을 제안하였으며, 랜덤 오버 샘플링 방식과 비교해 예측 성능이 뛰어나다고 나타난 방식을 최종 모형 구축에 활용하였다. 최종적으로 모수의 사전분포를 정규분포로 가정한 베이지안 위계적 로지스틱 회귀 모형을 구축하였으며, 머신러닝 모형과 비교를 통해 본 연구의 변수 선택 방법에 가장 적합한 통계적 모형이 무엇인지 제시하였다. 나아가, 랜덤 포레스트 기반의 변수 선택 방법으로 구축한 머신러닝 모형과 예측 성능을 비교해, 본 연구에서 제안한 변수 선택 방법론의 활용 가능성을 제시하고자 하였다.

more

목차

1. Introduction 2
1-1. Research Background 2
1-2. Research Purpose 4
2. Literature Review 6
2-1. Metaverse Usage 6
2-2. Prediction Modeling in Marketing 8
3. Theory of Research Methodology 12
3-1. Oversampling . 12
3-2. Bayesian Inference 14
3-3. Bayesian Network 16
3-4. Hierarchical Regression 21
3-5. Bayesian Logistic Regression 22
4. Research Method 23
4-1. Research Method Overview 23
4-2. Description of Research Data and Variables 25
4-3. Train and Test Data Split 30
4-4. Oversampling 31
4-5. Variable Selection 33
4-6. Prediction Models 35
4-7. Model Validation 36
4-8. Performance Comparison 37
5. Analysis and Results 39
5-1. Sample Statistics and Data Preprocessing 39
5-2. Oversampling 46
5-3. Variable Selection 47
5-4. Prediction Model Selection 60
5-5. Performance Comparison Results 65
6. Conclusion 67
6-1. General Discussion 67
6-2. Implication and Limitation 70
7. Reference 72

more