dCollection 디지털 학술정보 유통시스템

법률 삼단 논법 프롬프팅 기반 분류 모델을 활용한 형량 예측

Sentencing Prediction Using Classification Models with Legal Syllogism Prompting

원문보기

주제(키워드) 형량 예측 , 법률 판결 예측 , 법률 삼단 논법 프롬프팅 , 듀얼 인코더 , 설명가능성 평가 , sentencing prediction , legal judgment prediction , legal syllogism prompting , dual-encoder , explainability evaluation
발행기관 서강대학교 AI.SW대학원
지도교수 양지훈
발행년도 2026
학위수여년월 2026. 2
학위명 석사
학과 및 전공 AI.SW대학원 데이터사이언스 · 인공지능
실제URI http://www.dcollection.net/handler/sogang/000000082349
UCI I804:11029-000000082349
본문언어 한국어
저작권 논문은 저작권에 의해 보호받습니다.

초록(요약문)

본 논문은 한국 법원의 형사 양형을 대상으로 하는 다중 헤드 법률 판결 예측(Legal Judgment Prediction, LJP) 과제를 다룬다. LBox Open 의 LJP-Criminal 벤치마크를 활용하여 사건 사실관계로부터 벌금, 징역(노역 포함), 징역(노역 불포함)의 세 가지 제재 유형을 예측한다. 이를 위해 사실관계 정보와 양형 사유를 분리하여 인코딩하는 듀얼 인코더(dual- encoder) 아키텍처를 제안하고, 세 개의 독립적인 분류 헤드를 통해 제재 유형별 예측을 수행한다. 또한 법적 추론의 구조를 반영하기 위하여, 사건 정보를 전제 기반의 구조화된 요약으로 변환하는 Legal Syllogism Prompting(LSP) 모듈을 도입한다. 실험에서는 B0(사실관계+ 양형 사유를 사용하는 베이스라인), B1(학습 단계에서만 LSP 적용), B2(학습과 추론 모두에서 사실관계+LSP+양형 사유 적용)의 세 가지 구성을 비교하였다. 실험 결과, TF–IDF 기반 베이스라인은 macro-F1 이 약 0.38–0.47, 인코더 기반 B0 모델은 약 0.49–0.53 수준의 성능을 보였으며, B2 구성은 B0 대비 추가적인 성능 향상을 나타내어 KR-BERT 에서 macro-F1 ≈ 0.55 를 달성하였다. 더불어 feature removal 및 문장 중요도 점수 기반의 설명가능성 분석을 통해 예측에 기여하는 핵심 사실 문장을 식별하였다. 본 연구는 구조화 프롬프트(LSP)와 설명가능성 분석을 결합함으로써, 한국 형사 양형 예측을 위한 해석 가능한 모델링 접근법을 제시한다.

초록(요약문)

This thesis addresses multi-head legal judgment prediction (LJP) for criminal sentencing in Korean courts. Using the LBox Open LJP- Criminal benchmark, we predict three sanction types—fine, imprisonment with labor, and imprisonment without labor—from case facts. We propose a dual-encoder architecture that separately encodes factual information and sentencing reasons, then combines them via three independent classification heads. To incorporate legal reasoning structure, we introduce a Legal Syllogism Prompting (LSP) module that converts case information into a structured premise-based summary. We compare three configurations: B0 (baseline with facts+reason), B1 (LSP during training only), and B2 (facts+LSP+reason for both training and inference). TF–IDF baselines achieve macro-F1 scores around 0.38–0.47, while encoder-based B0 models reach approximately 0.49–0.53. B2 further improves over B0, achieving macro-F1 ≈ 0.55 with KR-BERT. Explainability analyses via feature removal and sentence importance scores reveal which factual sentences most influence predictions. The approach demonstrates that combining structured prompts (LSP) with explainability analysis provides an interpretable solution for Korean criminal sentencing prediction.

제 1 장 서 론 1
제 1 절 연구 배경 1
제 2 절 연구 목적 및 문제의식 3
제 3 절 연구 방법 및 논문 구성 4
제 2 장 관련 연구 7
제 1 절 형량 예측(LJP) 연구 7
제 2 절 해외 법률 벤치마크와 LJP 연구 8
제 3 절 한국어 법률 벤치마크와 LBOX OPEN 의 의의 9
제 4 절 대형 언어모델과 법률 삼단논법 프롬프팅 10
제 3 장 연구 방법 12
제 1 절 데이터셋 개요 12
제 2 절 레이블 체계 13
제 3 절 법률 삼단논법 기반 전처리 모듈 15
제 4 장 모델 구조 및 학습 방법 20
제 1 절 예측 목표 및 출력 공간 정의 20
제 2 절 인코더 기반 다중 헤드 듀얼 인코더 구조 22
제 3 절 LEGAL SYLLOGISM PROMPTING 결합 전략 25
제 4 절 손실 함수, 클래스 불균형 및 학습 환경 설정 27
제 5 장 실험 결과 29
제 1 절 전통 모형과 인코더 기반 모형의 비교 29
제 2 절 LSP 레짐별 성능 비교 30
제 3 절 선행연구와의 성능 비교 32
제 4 절 설명가능성 34
제 5 절 한계 및 향후 과제 38
참고 문헌 41

반출 Meta View 목록

서강대학교

검색 상세

법률 삼단 논법 프롬프팅 기반 분류 모델을 활용한 형량 예측

초록(요약문)

초록(요약문)

목차