dCollection 디지털 학술정보 유통시스템

합성데이터 품질 조정을 통한 균열 이미지 분할 모델 반복 학습

Iterative Training of Crack Segmentation Models through Synthetic Data Quality Refinement

원문보기

주제(키워드) 합성 데이터 , 균열 이미지 분할 , 반복 학습 , 데이터 정제 , 확산 모델 , Plug-and-Play 파이프라인 , Synthetic data , Crack Image Segmentation , Iterative Learning , Data Refinement , Diffusion Model , Plug-and-Play Pipeline
발행기관 서강대학교 일반대학원
지도교수 박운상
발행년도 2026
학위수여년월 2026. 2
학위명 석사
학과 및 전공 일반대학원 인공지능학과협동과정
실제URI http://www.dcollection.net/handler/sogang/000000082365
UCI I804:11029-000000082365
본문언어 한국어
저작권 논문은 저작권에 의해 보호받습니다.

초록(요약문)

본 연구에서는 균열 이미지 분할 모델의 성능 향상을 위해 합성 데이터 기반 반복 학습 및 데이터 정제 파이프라인을 제안한다. 기존 균열 검출 모델은 한정된 실제 데이터셋에 의존하여 데이터 다양성이 부족하고, 학습·평가 데이터 간 분포 차이로 인해 성능이 제한되는 한계가 있다. 이를 해결하기 위해 확산 모델 기반 이미지 편집 기법을 활용하여 균열이 없는 이미지를 기반으로 합성 균열 이미지를 생성하고, LPIPS 와 마스크 비율을 이용해 과도하거나 불충분한 균열 이미지를 자동으로 정제하였다. 합성 데이터와 실제 데이터를 결합해 학습을 진행한 뒤, IoU 값을 기준으로 데이터의 학습 기여도를 평가 및 재분배하는 과정을 반복 수행함으로써 데이터 품질을 지속적으로 개선하였다. 제안한 파이프라인은 Plug-and-Play 구조로 설계되어 다양한 균열 분할 모델에 적용 가능하며, Hybrid-Segmentor, U-Net, CSBSR 등을 CrackVision12K, khanhha, DeepCrack 데이터셋에서 실험한 결과, 제안한 파이프라인은 기본 모델에 비해 0.25%에서 최대 30.22%까지의 성능 향상을 달성하였다. 본 연구는 반복 학습을 통한 데이터 품질 개선이 균열 검출 성능 향상에 효과적임을 입증하며, 향후 비전 기반 결함 검출 및 구조물 모니터링 시스템으로의 확장을 기대할 수 있다.

초록(요약문)

This study presents an iterative training and data refinement pipeline that enhances crack image segmentation by leveraging synthetic data. To overcome the limited diversity of real datasets, we generate crack-free images using diffusion-based editing and synthesize new crack images by injecting crack masks, filtering low-quality samples using LPIPS and mask-area ratios. The refined synthetic data are combined with real images for training, and dataset quality is progressively improved by repeatedly evaluating and redistributing samples based on their IoU contribution. The pipeline follows a plug-and-play design and can be applied to various segmentation models. Experiments with Hybrid-Segmentor, U-Net, and CSBSR on CrackVision12K, khanhha, and DeepCrack demonstrate performance gains of 0.25% to 30.22% over baseline models. These results confirm the effectiveness of iterative synthetic data refinement for improving crack detection performance and suggest its potential for broader defect detection applications.

제 1 장 서론 1
1.1 연구 배경 1
1.2 논문의 구성 2

제 2 장 관련 연구 3
2.1 균열 분할 모델 3
2.1.1 Hybrid-Segmentor[4] 4
2.1.2 CSBSR[5] 5
2.1.3 U-Net[6] 6
2.2 균열 데이터셋 7
2.2.1 CrackVision12K[4] 8
2.2.2 khanhha 10
2.2.3 DeepCrack[14] 11

제 3 장 제안 파이프라인 13
3.1 데이터셋 생성 및 정제 단계 14
3.1.1 Lama[19] 15
3.1.2 Latent Diffusion[20] 17
3.1.3 UltraEdit[24]. 18
3.1.4 데이터셋 정제 기준 지표 및 정제 결과 20
3.2 균열 분할 모델 학습 단계 22
3.3 데이터셋 재분배 단계 23
3.3.1 데이터셋 재분배 기준 지표 24

제 4 장 실험 및 결과 25
4.1 실험 환경 25
4.2 Latent Diffusion 모델 사전학습 및 미세조정 25
4.3 데이터셋 별 생성 결과 27
4.4 균열 검출 모델 학습 결과 29
4.4.1 Hybrid-Segmentor 29
4.4.2 CSBSR 32
4.4.3 U-Net 32
4.5 소거 실험 33

제 5 장 결론 및 논의 37
5.1 결론 37
5.2 한계 38
5.3 향후 계획 39

제 6 장 참고 문헌 41

반출 Meta View 목록

서강대학교

검색 상세

합성데이터 품질 조정을 통한 균열 이미지 분할 모델 반복 학습

초록(요약문)

초록(요약문)

목차