합성데이터 품질 조정을 통한 균열 이미지 분할 모델 반복 학습
Iterative Training of Crack Segmentation Models through Synthetic Data Quality Refinement
- 주제(키워드) 합성 데이터 , 균열 이미지 분할 , 반복 학습 , 데이터 정제 , 확산 모델 , Plug-and-Play 파이프라인 , Synthetic data , Crack Image Segmentation , Iterative Learning , Data Refinement , Diffusion Model , Plug-and-Play Pipeline
- 발행기관 서강대학교 일반대학원
- 지도교수 박운상
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 석사
- 학과 및 전공 일반대학원 인공지능학과협동과정
- 실제URI http://www.dcollection.net/handler/sogang/000000082365
- UCI I804:11029-000000082365
- 본문언어 한국어
- 저작권 논문은 저작권에 의해 보호받습니다.
초록(요약문)
본 연구에서는 균열 이미지 분할 모델의 성능 향상을 위해 합성 데이터 기반 반복 학습 및 데이터 정제 파이프라인을 제안한다. 기존 균열 검출 모델은 한정된 실제 데이터셋에 의존하여 데이터 다양성이 부족하고, 학습·평가 데이터 간 분포 차이로 인해 성능이 제한되는 한계가 있다. 이를 해결하기 위해 확산 모델 기반 이미지 편집 기법을 활용하여 균열이 없는 이미지를 기반으로 합성 균열 이미지를 생성하고, LPIPS 와 마스크 비율을 이용해 과도하거나 불충분한 균열 이미지를 자동으로 정제하였다. 합성 데이터와 실제 데이터를 결합해 학습을 진행한 뒤, IoU 값을 기준으로 데이터의 학습 기여도를 평가 및 재분배하는 과정을 반복 수행함으로써 데이터 품질을 지속적으로 개선하였다. 제안한 파이프라인은 Plug-and-Play 구조로 설계되어 다양한 균열 분할 모델에 적용 가능하며, Hybrid-Segmentor, U-Net, CSBSR 등을 CrackVision12K, khanhha, DeepCrack 데이터셋에서 실험한 결과, 제안한 파이프라인은 기본 모델에 비해 0.25%에서 최대 30.22%까지의 성능 향상을 달성하였다. 본 연구는 반복 학습을 통한 데이터 품질 개선이 균열 검출 성능 향상에 효과적임을 입증하며, 향후 비전 기반 결함 검출 및 구조물 모니터링 시스템으로의 확장을 기대할 수 있다.
more초록(요약문)
This study presents an iterative training and data refinement pipeline that enhances crack image segmentation by leveraging synthetic data. To overcome the limited diversity of real datasets, we generate crack-free images using diffusion-based editing and synthesize new crack images by injecting crack masks, filtering low-quality samples using LPIPS and mask-area ratios. The refined synthetic data are combined with real images for training, and dataset quality is progressively improved by repeatedly evaluating and redistributing samples based on their IoU contribution. The pipeline follows a plug-and-play design and can be applied to various segmentation models. Experiments with Hybrid-Segmentor, U-Net, and CSBSR on CrackVision12K, khanhha, and DeepCrack demonstrate performance gains of 0.25% to 30.22% over baseline models. These results confirm the effectiveness of iterative synthetic data refinement for improving crack detection performance and suggest its potential for broader defect detection applications.
more목차
제 1 장 서론 1
1.1 연구 배경 1
1.2 논문의 구성 2
제 2 장 관련 연구 3
2.1 균열 분할 모델 3
2.1.1 Hybrid-Segmentor[4] 4
2.1.2 CSBSR[5] 5
2.1.3 U-Net[6] 6
2.2 균열 데이터셋 7
2.2.1 CrackVision12K[4] 8
2.2.2 khanhha 10
2.2.3 DeepCrack[14] 11
제 3 장 제안 파이프라인 13
3.1 데이터셋 생성 및 정제 단계 14
3.1.1 Lama[19] 15
3.1.2 Latent Diffusion[20] 17
3.1.3 UltraEdit[24]. 18
3.1.4 데이터셋 정제 기준 지표 및 정제 결과 20
3.2 균열 분할 모델 학습 단계 22
3.3 데이터셋 재분배 단계 23
3.3.1 데이터셋 재분배 기준 지표 24
제 4 장 실험 및 결과 25
4.1 실험 환경 25
4.2 Latent Diffusion 모델 사전학습 및 미세조정 25
4.3 데이터셋 별 생성 결과 27
4.4 균열 검출 모델 학습 결과 29
4.4.1 Hybrid-Segmentor 29
4.4.2 CSBSR 32
4.4.3 U-Net 32
4.5 소거 실험 33
제 5 장 결론 및 논의 37
5.1 결론 37
5.2 한계 38
5.3 향후 계획 39
제 6 장 참고 문헌 41

