동적 임계 값 기반 유해 구간 검출을 통한 영화 연령 등급 분류 시스템
Development of a Movie Age Rating System Based on Harmful Content Detection with Dynamic Threshold
- 주제어 (키워드) 영상물 등급 분류 , 멀티모달 , 유해 구간 검출 , 구간 등급 분류 , 트랜스포머 , 행동 인식 , 영상 분석; video rating classification , multi-modal , harmful section detection , section rating classification , transformer , action recognition , video analysis
- 발행기관 서강대학교 일반대학원
- 지도교수 박운상
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 석사
- 학과 및 전공 일반대학원 인공지능학과협동과정
- 실제 URI http://www.dcollection.net/handler/sogang/000000079314
- UCI I804:11029-000000079314
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
With the explosive growth of multimedia content and the proliferation of video-sharing and OTT services, the demand for automated content analysis in movie classification and rating systems is rapidly increasing. Existing movie rating systems predominantly rely on human interpretation of narrative, language, and explicit content, which introduces subjectivity and inconsistency. Moreover, most existing studies focus solely on text-based classification, limiting their ability to sufficiently reflect visual elements. The proposed system addresses these limitations through a four-step process: movie input, harmful section detection, classification of detected scenes, and final movie rating. Harmful scenes are identified based on visual elements such as violence and sexuality, enabling accurate and objective classification. Notably, the system incorporates a flexible threshold for detecting harmful sections, allowing for a more precise reflection of the harmful content that can arise in diverse contexts. As a result of the experiment, an accuracy of 70.96% was achieved based solely on visual input according to the movie rating system. The dataset used in this study includes rating information for each section, harmful sections, and the overall rating of the actual movie. Based on these results, the performance was further enhanced by integrating subtitle and audio information, achieving a final movie rating classification accuracy of 85.42%. This demonstrates the potential of multimodal approaches to improve classification precision and robustness. This system provides an objective and automated approach to content management and compliance, promoting a safer viewing environment for diverse audiences.
more초록 (요약문)
동적 임계 값 기반 유해 구간 검출을 통한 영화 연령 등급 분류 시스템 멀티미디어 콘텐츠의 폭발적인 증가와 비디오 공유 및 OTT 서비스의 확산으로 인해 영화 분류 및 등급 시스템에 대한 자동화된 콘텐츠 분석의 필요성이 커지고 있다. 기존의 영화 등급 분류 시스템은 주로 내러티브, 언어, 노골적인 콘텐츠에 대한 인간의 해석에 의존하며, 이는 주관성과 일관성 부족을 초래할 수 있다. 또한, 대부분의 기존 연구는 텍스트만 사용하여 등급을 분류하기 때문에 시각적 요소를 충분히 반영하지 못한다는 한계가 있다. 제안된 시스템은 영화 입력, 유해 구간 검출, 검출된 장면의 등급 분류, 최종 영화 등급 분류의 네 가지 단계를 거친다. 폭력성, 선정성과 같은 시각적 요소를 기반으로 유해 장면을 식별하고, 이들에 대한 정확하고 객관적인 등급 분류를 수행한다. 특히, 유해 구간 탐지를 위해 유연한 임계 값을 적용하여 다양한 콘텐츠에서 발생할 수 있는 유해성을 보다 정밀하게 반영하도록 설계되었다. 실험 결과, 영화등급체계에 따른 시각적 입력만을 기준으로 70.96%의 정확도를 달성하였다. 본 연구에서 사용된 데이터세트에는 구간별 등급 정보와 유해 구간, 실제 영화에 대한 종합 등급 정보가 포함되어 있다. 이러한 결과를 바탕으로 자막과 오디오 정보를 통합해 성능을 더욱 향상시켜 최종 영화 등급 분류 정확도 85.42%를 달성했다. 이는 분류 정밀도와 견고성을 향상시키기 위한 다중 모드 접근 방식의 잠재력을 보여준다. 본 시스템은 콘텐츠 관리와 규제 준수에서 객관적이고 자동화된 접근 방식을 제공함으로써, 다양한 시청자에게 보다 안전한 시청 환경을 촉진할 수 있다.
more목차
제 1 장 서론 1
1.1 연구 배경 1
1.2 논문의 구성 2
제 2 장 관련 연구 5
2.1 영화 등급 분류 시스템 5
2.2 Harmful Segment Detection 6
2.3 Weakly Supervised Learning [6] 7
2.4 Video Classification [8, 9] 8
2.5 Multi-Scale Vision Transformer [17] 10
제 3 장 Method 12
3.1 시스템 아키텍처 overview 12
3.2 영화 분할 14
3.3 유해 구간 검출 15
3.3.1 동적 임계 값 설정 15
3.3.2 유해성 점수 기반 유해 구간 검출 방법 17
3.4 비전 영화 등급 분류 19
3.5 전체 영화 등급 분류 20
제 4 장 실험 및 결과 22
4.1 데이터 세트 22
4.1.1 연령 등급 태깅 기준 23
4.2 실험 내용 24
4.2.1 벤치마크 모델 미세 조정 성능 비교 26
4.2.2 유해 구간 검출 방법 비교 실험 28
4.2.3 동적 임계 값 변화 실험 31
4.2.4 영화 구간 분할 실험 32
4.2.5 MLP Layer Activation Function 비교 32
4.2.6 비전, 자막 및 오디오 정보 통합 최종 영화 등급 분류 33
4.3 실험 결과 34
4.3.1 벤치마크 모델 미세 조정 성능 34
4.3.2 유해 구간 검출 방법 비교 실험 결과 37
4.3.3 동적 임계 값 변화 실험 결과 39
4.3.4 영화 구간 분할 실험 결과 45
4.3.5 MLP Layer Activation Function 비교 실험 결과 46
4.3.6 비전, 자막 및 오디오 정보 통합 최종 영화 등급 분류 48
제 5 장 결론 및 논의 사항 52
제 6 장 참고 문헌 54