검색 상세

GNN을 활용한 콘텐츠 인게이지먼트 예측 모델 연구 : 버티컬커머스 플랫폼 커뮤니티를 중심으로

초록 (요약문)

본 연구는 버티컬커머스 플랫폼의 인게이지먼트를 예측하기 위하여 Heterogeneous Graph Neural Network(HeteroGNN)을 활용한 접근법을 제안하였다. 이를 통해 커뮤니티의 구조적 정보가 인게이지먼트 예측 성능 향상에 기여하는지 검증하고, 버티컬커머스 플랫폼에서 소비자의 인게이지먼트를 극대화할 수 있는 운영전략 개선에 기여하고자 한다. 최근 뷰티, 패션, 인테리어 등 특정 제품군에 전문화된 버티컬커머스 플랫폼은 꾸준한 거래액 증가를 보이고 있으나 전반적인 온라인 커머스 플랫폼에 관한 연구에 비해 버티컬커머스 플랫폼에 집중한 연구는 부족한 상황이다. 버티컬커머스 플랫폼의 핵심적인 특징 중 하나는 커뮤니티를 기반으로 공통된 관심사를 가진 이용자들 간의 자발적인 상호작용이 활발하게 형성된다는 점이다. 선행연구에 따르면, 이러한 현상은 플랫폼 내 인게이지먼트 증가를 넘어 적극적인 충성도로 이어지며, 플랫폼의 경제적 가치를 증가시킨다. 따라서 버티컬커머스 플랫폼 운영 전략 측면에서 커뮤니티 내 인게이지먼트는 매우 중요한 요소 중 하나이다. 하지만 복잡한 네트워크 구조의 커뮤니티에서 수많은 콘텐츠 가운데 어떤 콘텐츠가 이용자들의 인게이지먼트를 극대화할지 정확하게 예측하는 것은 매우 어려운 일이다. 본 연구는 대표적인 버티컬커머스 플랫폼인 ‘오늘의 집’의 커뮤니티 데이터를 기반으로, 콘텐츠의 정량적 인게이지먼트 지표(좋아요, 저장, 댓글, 공유, 조회수)를 예측하였다. 복잡한 관계 구조를 효과적으로 반영하기 위해 본 연구에서는 HeteroGNN 모델을 적용한다. 구체적으로 사용자, 콘텐츠, 카테고리 등 다양한 노드 타입과 댓글, 스크랩, 업로드 등의 다양한 엣지 타입으로 구성된 heterogeneous graph를 구축하였다. 콘텐츠 노드는 수치형 데이터와 본문 텍스트 임베딩, 댓글 텍스트 임베딩을 포함한 고차원 특성으로 표현되며 사용자 및 카테고리 노드는 플랫폼 내 활동 정보에 기반한 수치형 특성으로 구성된다. 모델 학습에는 DeepSNAP 기반 HeteroGNN 모델 구조를 사용하며, 각 GNN 레이어는 서로 다른 노드 및 엣지 타입 간의 메시지 패싱(message passing)을 수행한다. 본 연구는 3개의 GNN 레이어를 통해 최대 3-hop 이웃 노드로부터 정보를 집계하고 이를 콘텐츠 노드의 표현에 반영하여 콘텐츠의 인게이지먼트 지표를 multi-target 회귀문제로 예측하였다. 분석 결과, 제안된 GNN 모델은 단순 평균을 기반으로 하는 feature 집계 방식보다 콘텐츠 인게이지먼트 예측에서 우수한 성능을 보였으며, 이는 복잡한 커뮤니티 구조와 이웃 정보를 반영하는 GNN의 강점을 시사한다. 또한, ablation study 결과 콘텐츠 자체 정보와 텍스트 기반 정보, 네트워크 기반 영향력은 인게이지먼트에 매우 유의미한 요소로 드러났으며 사용자 활동성 정보는 상대적으로 영향력이 낮은 것으로 드러났다. 본 연구의 결과는 버티컬커머스 플랫폼 내 커뮤니티 활성화를 위한 운영전략 개선에 기여할 수 있으며, 인게이지먼트 예측에 있어 관계 기반 정보의 중요성을 발견하고 GNN 모델의 구조적 관계 학습 능력을 실증적으로 입증하였다.

more

목차

제 1 장. 서론(Introduction) 1
1.1 연구 배경 및 연구 필요성 1
1.2 연구 목적 3

제 2 장. 이론적 배경(Literature Review) 5
2.1 버티컬커머스 플랫폼 5
2.2 소비자 인게이지먼트 예측 6
2.3 신경망 모델(Neural Network Model) 9
2.4 그래프 기반 모델링 11
2.4.1 Graph Neural Network(GNN) 11
2.4.2 Heterogeneous Graph Neural Network 13
2.4.3 DeepSNAP 라이브러리 15
2.4.4 DeepSNAP 기반 HeteroGNN 16
2.5 XGBoost 기반 예측 (비교모델) 18

제 3 장. 연구방법론(Methodology) 20
3.1 데이터 수집 20
3.2 데이터 구성 20
3.3 예측 변수 설정 22
3.4 그래프 데이터 22
3.5 그래프 데이터 전처리 27

제 4 장. 모델 구조(Model Architecture) 32
4.1 모델 입력 구조 32
4.2 모델 모듈 구조 33
4.3 손실함수 및 하이퍼파라미터 설정 33
4.4 모델 성능 검증 지표 34

제 5 장. 연구 결과(Results) 36
5.1 HeteroGNN 모델 예측 결과 36
5.2 XGBoost 모델 예측 결과 37
5.3 Ablation Study 39

제 6 장. 결론 및 시사점(Conclusion) 42
6.1 연구 결과 요약 42
6.2 이론적 시사점 43
6.3 실무적 시사점 44
6.4 연구의 한계 및 향후 연구 제안 45

참고문헌 47

more