검색 상세

세무·회계 계정과목 분류를 위한 검색 증강 시스템 개발

Development of a Retrieval-Augmented System for Tax and Accounting Account Classification

초록 (요약문)

본 연구는 세무·회계 실무에서 반복적으로 수행되는 지출 건 분류 업무를 자동화하기 위한 자연어 처리 기반 분류 시스템을 제안한다. 거래처명, 업태, 업종 등 비정형 텍스트로 구성된 입력 데이터를 대상으로, 문맥 의미를 반영하는 임베딩 기법과 분류 모델을 구성하고, 기존의 딥러닝 기반 방식과 대규모 언어모델 기반 구조의 성능을 비교하였다. 먼저, Sentence-BERT 임베딩과 다층 퍼셉트론(DNN) 기반의 분류기를 설계하였고, 데이터 불균형 문제를 완화하기 위해 2 단계 분류 구조를 도입하였다. 이어서 FAISS 벡터 검색과 GPT-4o 를 활용한 Retrieval-Augmented Generation(RAG) 구조를 구현하였으며, 유사 사례 검색 기반의 프롬프트 응답을 통해 계정과목 분류와 그 사유(reason)를 함께 제공할 수 있도록 설계하였다. 실험 결과, RAG + GPT-4o 모델은 F1-score 96.8% 이상의 성능을 기록하였으며, 설명 가능한 응답을 통해 실무 수용성과 사용자 신뢰성을 동시에 확보할 수 있음을 보였다. 또한 다양한 임베딩 모델 중 E5-Large 모델이 가장 높은 정확도(97.3%)를 기록하였고, ko-sroberta-multitask 는 정밀도 및 F1-score 측면에서 뛰어난 성능을 보여주며, 임베딩 선택이 전체 성능에 미치는 영향이 큼을 실증하였다. 본 연구는 비정형 회계 입력 텍스트의 자동 분류 가능성을 실증하고, 향후 세무 자동화 시스템의 설계 및 도입에 실질적 기여를 할 수 있다.

more

초록 (요약문)

This study proposes a natural language processing (NLP)-based classification system to automate the account categorization of business expenses in tax and accounting practices. Focusing on unstructured textual inputs such as vendor name, business type, and industry, we developed context-aware embedding and classification models and compared the performance of traditional deep learning- based and Large Language Model (LLM)-based approaches. The first approach employed Sentence-BERT embeddings and a Deep Neural Network (DNN) classifier, incorporating a two-stage classification structure to address class imbalance. The second approach implemented a Retrieval-Augmented Generation (RAG) framework using FAISS-based vector retrieval and GPT-4o. The model was designed to return not only the predicted account category but also a natural language explanation (reason) for its decision. Experimental results show that the RAG + GPT-4o model achieved a macro F1- score of over 96.8%, demonstrating high classification performance along with interpretable outputs. Among various embedding models tested, the multilingual E5-Large model yielded the highest overall accuracy (97.3%), while the Korean-specialized ko-sroberta- multitask showed top precision and F1-score, demonstrating the importance of embedding model selection. This research validates the feasibility of automated classification of unstructured accounting entries and contributes to the practical advancement of intelligent tax automation systems.

more

목차

제 1 장 서론 1
제 2 장 이론적 배경 및 관련 연구 3
제 1 절 세무회계 계정과목 분류 개요 3
제 2 절 자연어 처리 기반 텍스트 분류 기법 5
제 3 절 딥러닝 임베딩 기반 분류 (SENTENCE TRANSFORMER, DNN) 7
제 4 절 RETRIEVAL-AUGMENTED GENERATION (RAG) 개념과 구조 9
제 5 절 프롬프트 엔지니어링 및 LLM 활용 사례 10
제 3 장 세무, 회계 계정과목 분류 시스템 연구 13
제 1 절 세무회계 데이터셋 구성 및 전처리 13
제 2 절 센텐스 임베딩 기반 딥러닝 분류 시스템 19
제 3 절 RAG 기반 LLM 분류 시스템 22
제 4 장 실험 및 결과 분석 28
제 1 절 실험 환경 및 평가 지표 28
제 2 절 성능 평가 결과 31
제 3 절 결과 분석 34
제 5 장 결론 및 향후 연구 38

more