앙상블 및 convolution layer와 attention layer 결합을 통한 강인한 경량 신체 노출 분류기
Robust and Lightweight Body Exposure Classifier by Merging Convolution and Attention layers with Ensemble
- 주제어 (키워드) 신체 노출 분류기 , 하이브리드 모델 , 지식 증류 , 경량화 , 앙상블 , 데이터 증강 , Body Exposure Classifier , Hybrid Model , Knowledge Distillation , Quantization , Ensemble , Data Augmentation
- 발행기관 서강대학교 일반대학원
- 지도교수 박운상
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 석사
- 학과 및 전공 일반대학원 인공지능학과협동과정
- 실제 URI http://www.dcollection.net/handler/sogang/000000079316
- UCI I804:11029-000000079316
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
최근 1인 미디어와 OTT 산업의 발달로 인해 많은 양의 영상이 생성되고 있고, 이로 인해 등급 분류가 진행되어야 하는 영상의 수 또한 늘어나고 있다. 특히 청소년 보호 및 미디어 플랫폼의 컨텐츠 관리 측면에서 Not Safe for Work (NSFW)와 같은 부적절 컨텐츠 분류는 필수적이며 이 중 신체 노출 분야에 대한 분류에 초점이 맞춰지고 있다. 본 논문의 연구에서는 신체 노출 분류기의 높은 분류 성능을 위해 다양한 fine- tuning 된 모델들을 하나의 단일 모델로 만드는 model soup 방법을 사용했다. 또한 기존 분류기의 큰 모델 크기 문제를 해결하기 위해 추가적으로 ResNet18 모델과 EfficientNet의 후반부에 있는 Convolution Layer를 Transformer Encoder로 변경한 hybrid model을 제안하였으며 추가적으로 Knowledge Distillation을 통한 경량화 역시도 시도했다. 이를 통해 기존 대비 최대 45배까지 모델 크기와 모델 파라미터 수를 줄이면서도 성능을 유지할 수 있었으며 본 연구의 결과를 기존 논문 결과와 비교함으로써 제안한 방법의 효율성과 경쟁력을 입증하였다.
more초록 (요약문)
Due to the recent development of personal media and the OTT industry, a large volume of videos is generated, increasing the number of videos that require classification for appropriate ratings. Classifying inappropriate content such as Not Safe for Work (NSFW), especially Body Exposure is essential for youth protection and content management on media platforms. This thesis employs the model soup approach, combining various fine-tuned models into a single model to achieve high classification performance for body exposure. To address the issue of large model sizes in existing classifiers, a hybrid model was proposed by replacing the Convolution Layers in the latter parts of ResNet18 and EfficientNet with Transformer Encoders. Additionally, lightweighting through Knowledge Distillation was explored. As a result, up to a 45-fold reduction in model size and parameter count was achieved while maintaining performance. By comparing these results with those from existing studies, the efficiency and competitiveness of the proposed approach were demonstrated.
more목차
제 1 장 서론 1
1.1 연구 배경 1
1.2 논문의 구성 3
제 2 장 관련 연구 4
2.1 신체 노출 분류 4
2.2 경량화 5
2.3 Hybrid Model 5
2.4 CoAtNet 6
2.5 Knowledge Distillation 7
2.6 Ensemble 8
2.7 Soft Augmentation 8
2.8 Model Soup 10
제 3 장 신체 노출 분류기의 성능 향상 및 경량화 11
3.1 CoAtNet과 Model Soup을 통한 성능 향상 11
3.2 Knowledge Distillation을 통한 경량화 12
3.3 Hybrid 모델 제안을 통한 성능 향상 및 경량화 14
제 4 장 실험 및 결과 18
4.1 실험 환경 18
4.2 데이터셋 18
4.2.1 NudeNet Dataset 19
4.2.2 데이터셋 분포 22
4.3 실험 내용 23
4.3.1 CoAtNet 과 Model Soup 을 사용한 실험 23
4.3.2 Knowledge Distillation을 적용한 실험 25
4.3.3 모델 구조 변경을 통한 hybrid 모델 실험 28
4.4 추가 실험 결과 30
4.4.1 NudeNet 데이터셋의 3 가지 클래스에 대한 실험 31
4.4.2 영화 데이터셋에 대한 실험 34
제 5 장 결론 및 논의 사항 40
제 6 장 참고 문헌 41