Case Studies of Deep Learning Performance Improvement Using Data Augmentation Techniques : Focusing on Road Sign Recognition, Historical Document Restoration, and OLED Defect Detection
- 주제어 (키워드) Data Augmentation , Computer Vision , Generation Models , 데이터증강 , 컴퓨터비전 , 생성모델
- 발행기관 서강대학교 일반대학원
- 지도교수 서용덕
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 박사
- 학과 및 전공 일반대학원 아트&테크놀로지
- 실제 URI http://www.dcollection.net/handler/sogang/000000079568
- UCI I804:11029-000000079568
- 본문언어 영어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
Improving the performance of deep learning models in data-constrained environments remains a major challenge in both practical and research contexts. When large-scale datasets are difficult to obtain, data augmentation techniques offer a powerful means to enhance generalization by enabling models to learn from diverse patterns even with limited data. This paper explores three primary strategies traditional transformations, composition-based methods,— and generation model-based approaches and demonstrates their— applications across multiple domains. Traditional transformations (e.g., rotation, flipping, scaling) are straightforward but can produce unrealistic distortions in data that rely heavily on semantic integrity, such as character images, road signs, and OLED defect images. Composition-based methods (e.g., Mixup, text-based synthesis) strive for greater variability but may still generate impractical combinations or overlook domain-specific nuances. Meanwhile, generation model-based approaches (e.g., GANs, diffusion models) excel at creating novel patterns and expanding semantic information, although they require substantial computational resources and domain expertise. This study applies the above techniques to modern and historical character images, road signs, and OLED defect images, illustrating each method’s strengths and limitations. Building on these insights, we propose a domain-focused augmentation framework that more effectively reproduces rare patterns than basic geometric or compositional approaches. Our empirical evaluation confirms that strategies incorporating conditional generation, style parameter control, and partial diffusion model integration can significantly bolster data diversity and fidelity. In summary, this work provides a practical reference for selecting and adapting data augmentation techniques in data-constrained scenarios. By clarifying the trade-offs between traditional, composition-based, and generative methods and proposing ways to tailor them according— to domain needs we help practitioners and researchers design robust— augmentation pipelines that deliver measurable performance gains.
more초록 (요약문)
제한된 데이터 환경에서 딥러닝 모델의 성능을 향상시키는 것은 실무 및 연구 현장에서 중요한 과제이다. 대규모 데이터 확보가 쉽지 않은 상황에서 데이터 증강(Data Augmentation) 기법은 적은 데이터로도 모델이 다양한 패턴에 적응하도록 만들어 일반화 성능을 개선하는 핵심 전략 중 하나로 주목받고 있다. 본 논문은 이러한 제한된 데이터 환경을 극복하기 위해 전통적 변환 기법, 합성 기반 기법, 그리고 생성 모델 기반 기법을 심층적으로 고찰하고 실제 응용 사례를 제시한다. 먼저 전통적 변환(회전, 반전, 스케일링 등)은 간단하고 적용하기 쉽지만, 글자 이미지나 도로 표지판, OLED 결함 이미지와 같이 의미론적 정보가 중요한 데이터에서는 비현실적인 변형으로 의미를 훼손하는 한계를 보였다. 합성 기반 기법(Mixup, 텍스트 합성, 규칙 기반 합성 등)은 전통적 변환보다 한 단계 높은 다양성을 제공하지만, 여전히 비현실적 조합 문제나 도메인 특성 반영 부족으로 인해 기대한 만큼 성능 개선을 이루지 못했다. 반면 생성 모델 기반 기법(GAN, Diffusion 모델)은 의미론적 정보 확장과 새로운 패턴 생성에 유리한 잠재력을 가졌으나, 학습 안정성, 계산 자원 요구, 도메인 지식 반영 필요성 등의 현실적 제약이 존재한다. 본 연구는 글자 이미지(현대 폰트·고문서), 도로 표지 이미지, OLED 결함 이미지라는 서로 다른 도메인에 각 기법을 적용한 사례를 통해 이러한 문제점을 구체화하고, 이를 바탕으로 실제 연구 과정(4장)에서 구현된 데이터 증강 전략과 시스템을 소개한다. 이를 통해 단순한 기하학적 변환이나 합성이 아닌, 도메인 특화된 조건부 생성, 스타일 파라미터 제어, 부분적 Diffusion 모델 적용 등의 전략이 의미 있는 데이터 다양성 확보 및 희소 패턴 재현에 기여할 수 있음을 확인하였다. 본 논문의 기여는 제한된 데이터 환경에서의 데이터 증강 전략 선정과 활용을 위한 참고점 마련에 있다. 전통적·합성·생성 모델 기반 기법 각각의 장단점을 구체적으로 파악하고, 도메인 특성에 맞추어 적절히 혼합·응용하는 전략을 제안함으로써, 향후 연구자 및 실무자가 더욱 효과적인 증강 기법을 설계하고 성능 개선을 이끌어낼 수 있도록 돕는다.
more목차
Chapter 1. Introduction 1
Chapter 2. Background Theories 4
2.1 Data Augmentation 5
2.2 Traditional Image Transformation Techniques 7
2.3 Composition based methods 9
2.4 Generation Model-based Approaches 12
2.5 Practical Considerations and Directions 14
Chapter 3. Applications and Analysis of Data Augmentation 16
3.1. Applying Traditional Techniques 18
3.2. Application of Composition based Methods 26
3.3. Application of Generation Model based Data Augmentation 35
Chapter 4. Case Studies of Data Augmentation for Performance
Improvement 47
4.1. Historical Document Augmentation and Restoration 48
4.2. Data Augmentation for Road Sign Recognition Systems 55
4.3. Data Acquisition and Augmentation for OLED Defect Detection 62
4.4. Comprehensive Overview of Data Augmentation Methods 69
Chapter 5. Conclusion and Future Work 72
Reference 75