검색 상세

유사 아이템 검색 이력 기반의 SimCSE 아이템 임베딩 기법을 활용한 콜드 스타트 해결 방안

초록 (요약문)

이커머스 산업에서 추천 시스템은 사용자의 쇼핑 경험을 향상시키고 매출을 증가시키는데 크게 기여하고 있다. 최근 몇 년간, 딥러닝 기반의 추천 시스템이 주목받고 있으며, 추천 시스템에 대한 연구와 실험도 활발히 진행되고 있다. 그러나 본질적으로 유저-아이템 상호작용 데이터에 기반한 추천 시스템은 새로운 아이템이나 새로운 유저에게 적합한 추천을 제공하기 어려운 "콜드 스타트" 문제를 가지고 있다. 기존의 콜드 스타트 문제에 대한 연구는 대부분 콘텐츠 정보를 협업 필터링 추천 방법에 통합하는 데 초점을 맞추었다. 그러나 대부분의 연구는 비즈니스 데이터셋에 적용하기에는 추천 결과가 만족스럽지 않아 직접적으로 적용할 수 없다는 한계점이 있다. 본 논문은 비즈니스 데이터셋의 특성을 고려하면서 콜드 아이템 문제에 대한 해결책을 제시한다. 첫째, 비즈니스에서 실제로 마주하는 데이터는 많은 결측값이 많고 지저분하기 때문에, 결측 데이터를 제거하지 않고 학습에 사용할 수 있는 방법을 제안하였다. 둘째, 고정된 실험 데이터셋에 맞는 복잡한 모델을 설계하는 대신, 비즈니스 환경에서 추가적으로 데이터를 수집 및 획득하여 비교적 간단한 모델로 콜드 아이템 문제를 해결할 수 있는 방법을 제안하였다. 본 논문에서는 구매 기록이 없는 콜드 아이템의 유저-아이템 상호작용 데이터를 검색 기록 데이터로 보강하는 방법을 제안한다. 검색 기록을 통해 학습된 상품 임베딩 벡터를 활용하여 콜드 아이템과 유저를 연결할 수 있는 알고리즘을 제시한다.

more

초록 (요약문)

In the e-commerce industry, recommendation systems play a crucial role in enhancing users' shopping experiences and driving sales. Deep learning-based recommendation systems have garnered significant attention, leading to active research and experimentation in this field. However, recommendation systems based on user-item interaction data face the challenge of cold start problems, which arise when it becomes difficult to provide appropriate recommendations for new items or new users. Previous studies on cold start problems have mainly focused on integrating content information into collaborative filtering recommendation methods. Nonetheless, most of these approaches are not directly applicable to business datasets due to suboptimal recommendation results. In this paper, we propose a novel method that addresses the cold item problem while considering the specific characteristics of business datasets. Our approach encompasses two key aspects: Firstly, we recognize that real-world data is often characterized by missing values and complexity. To overcome this, we introduce a method that enables learning from data with missing values instead of discarding it. This allows us to effectively handle the messy nature of business datasets. Secondly, rather than designing intricate models tailored to fixed datasets, our proposed method focuses on additional data collection and acquisition within the business environment. By doing so, we address the cold item problem using a relatively simple model. Specifically, we present a method to enhance the user-item interaction data of cold items lacking purchase history by incorporating search history data. Through the utilization of product embedding vectors learned from search history, we outline an algorithm that establishes connections between cold items and users.

more