비유 표현의 시나리오 기반 위상적 점수화
Scenario-Anchored Topological Scoring in Figurative Expression
- 발행기관 서강대학교 일반대학원
- 지도교수 양지훈
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000082426
- UCI I804:11029-000000082426
- 본문언어 한국어
- 저작권 논문은 저작권에 의해 보호받습니다.
초록(요약문)
비유적 표현은 여전히 언어 모델에게 도전적인 과제로 남아 있으며, 이러한 모델은 종종 암시적 의미를 포착하기보다는 문자적 해석에 의존하는 경향을 보인다. 이러한 취약성은 일상적 대화의 의미 이해를 저해할 뿐만 아니라, 비유적이거나 간접적인 표현을 활용하는 적대적 프롬프트에 대한 노출을 증가시킨다. 본 연구에서는 토폴로지 기반 알고리즘을 인코더 전용 아키텍처에 통합하여 비유적 의미와 관련된 신호를 강화하였으며, 여러 벤치마크에서 일관된 성능 향상을 관찰하였다. 또한, 비유적 표현을 위한 시나리오 기반 토폴로지 점수화 기법(Scenario-Anchored Topological Scoring in Figurative expression, SATS)을 제안하며, 이는 낮은 지연을 유지하면서도 대부분의 오픈소스 LLM보다 우수하거나 동등한 성능을 보였고, Qwen3 대비 9.6배 적은 파라미터로도 0.8%p 이내의 차이를 기록하였다. 제안된 방법은 경량하고 모델 비종속적이며, 명령어 튜닝된 LLM의 비유적·암시적 의미 탐지 및 해석의 강건성을 향상시키는 보완적 접근으로 기능한다. 주제어(키워드, 색인어) 비유적 표현, 위상적 데이터 분석, 언어 모델의 어텐션 구조
more초록(요약문)
Figurative expressions remain challenging for language models, which often default to literal interpretations rather than capturing implicit meaning. This vulnerability affects the understanding of everyday dialogue and increases the exposure to adversarial prompts that exploit figurative or indirect phrasing. We integrate a topology-based algorithm into encoder-only architectures to strengthen signals relevant to figurative meaning and observe consistent improvements across multiple benchmarks. We further propose SATS(Scenario-Anchored Topological Scoring in Figurative expression), which achieves low latency and matches or exceeds most open-source LLMs while using 9.6× fewer parameters (within 0.8%p of Qwen3). Our approach is lightweight and model-agnostic, and complements instruction-tuned LLMs by improving the robustness of detecting and interpreting figurative and implicit meaning. Keywords Figurative expressions, Topological Data Analysis, Attention Structure of Language Model
more목차
제 1 장 서론 1
제 2 장 선 행 연 구 4
2.1 비유적 표현 연구 4
2.2 TDA 연구 5
2.2.1 TDA 배경 5
2.2.2 Topological BERT와 어텐션 구조 분석 9
2.2.3 Artificial Text Detection 11
2.2.4 Topological Features Extraction 13
2.2.5 기타 TDA 기반 자연어처리 및 관련 연구 15
제 3 장 방 법 론 17
3.1 어텐션 그래프와 필트레이션 기반 지속성 호몰로지 17
3.2 Representation Topology Divergence (RTD) 22
3.3 시나리오 기반 위상학적 점수 부여 28
3.3.1 죽음과 widest path의 동치성 30
3.3.2 SATS의 Lipschitz 안정성과 하한 특성 32
제 4 장 실험 및 결과 35
4.1 데이터셋 35
4.2 모델 36
4.3 실험 설정 37
4.4 실험 결과 40
4.5 Ablation Study 46
4.6 SATS의 동작 방식 해석 50
제 5 장 결론 및 향후 연구 56
참 고 문 헌 58

