신중년 구직자를 위한 RAG(Retrieval-Augmented Generation) 기반 일자리 추천 시스템
RAG(Retrieval-Augmented Generation) Based Job Recommendation System for Middle-Aged Job Seekers
- 주제어 (키워드) 신중년 구직자 , 일자리 추천 시스템 , 검색 증강 생성 , 질의 확장 , 대형 언어 모델 , Middle-Aged Job Seekers , Job Recommendation System , RAG(Retrieval-Augmented Generation) , Query Expansion , LLM(Large Language Model)
- 발행기관 서강대학교 정보통신대학원
- 지도교수 장부루
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000079185
- UCI I804:11029-000000079185
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
본 연구는 주된 일자리에서 퇴직하고 재취업을 준비하는 대한민국 신중년 구직자들의 사회적 참여를 증진하기 위해, 기존 취업 지원 시스템의 한계를 극복하고 디지털 친화적이며 설명 가능한 대화형 일자리 추천 시스템을 제안한다. 이 시스템에서는 RAG (Retrieval-Augmented Generation) 기술을 활용하여 구직자의 다양한 요구와 맥락을 반영한 자연어 질문을 효과적으로 처리하고, 관련성 높은 일자리 정보를 명확한 추천 이유와 함께 제공함으로써 추천 시스템의 투명성과 신뢰성을 높였다. 본 연구에서는 Query Expansion(질의 확장) 기법을 도입하여 구직자의 초기 쿼리를 확장함으로써 RAG 기반 일자리 추천 시스템의 성능을 향상시키는 방법을 탐구하였다. 실험 결과, Query Expansion을 적용한 추천 결과가 초기 쿼리 기반 추천 결과보다 더 높은 관련성과 논리적 일관성을 보였다. 또한, LLM을 통한 자동 성능 평가 방법을 도입함으로써 시스템의 초기 개발 단계에서도 모델의 성능을 신속하고 효과적으로 검증할 수 있음을 확인하였다.
more초록 (요약문)
This study proposes an explainable interactive job recommendation system for middle-aged job seekers in South Korea to enhance their social participation. Using Retrieval-Augmented Generation (RAG) technology, the system effectively processes natural language queries from job seekers, reflecting their diverse needs and contexts, and provides highly relevant job information along with clear rationales for recommendations. This enhances the transparency and reliability of the recommendation system. The study explores the integration of Query Expansion techniques to enhance initial queries, thereby improving the performance of the RAG-based job recommendation system. Experimental results show that the recommendations generated with Query Expansion demonstrated higher relevance and logical consistency compared to those based on initial queries. Additionally, the introduction of an automatic performance evaluation method using LLM(Large Language Model) enables quick and effective verification of the model's performance during early development stages, even in the absence of sufficient user evaluation data.
more목차
제1장 서 론 1
제1절 연구 배경 1
제2절 연구 목적 2
제2장 선행연구 4
제1절 신중년 구직자 일자리 관련 연구 4
제2절 RAG(Retrieval-Augmented Generation) 5
(1) RAG의 등장배경 5
(2) RAG의 구조 6
(가) 검색기(Retriever) 6
(나) 생성기(Generator) 9
제3장 문제 정의 및 방법론 10
제1절 문제 정의 10
(1) RAG 기반 일자리 추천 시스템의 정의 10
제2절 방법론 10
(1) 데이터 셋 11
(가) 구직 정보 11
(나) 구직자 쿼리 12
(2) RAG 파이프라인 설계 12
(가) Data Load & Embedding (데이터 로드 및 임베딩) 13
(나) Retrieval (정보 검색) 13
(다) Generation (응답 생성) 13
(3) Query Expansion (질의 확장) 14
(4) LLM 기반 성능 평가 15
(가) GPT-4를 활용한 자동 평가 16
(나) 사람을 통한 재검증 17
제4장 실험 및 분석 18
제1절 실험 환경 18
(1) Data Load & Embedding (데이터 로드 및 임베딩) 18
(2) Retrieval (정보 검색) 19
(3) Generation (응답 생성) 19
제2절 성능 평가 및 분석 19
(1) 성능 평가(Evaluation) 19
(가) 성능 평가 결과 20
(2) 결과 분석 22
제3절 사례 연구(Case Study) 23
(1) Query Expansion 전과 후의 비교 23
(2) 응답 생성 결과 24
제5장 결 론 27
제1절 연구 결과 및 시사점 27
제2절 연구의 한계 및 향후 과제 28
참고문헌 30