검색 상세

CNN 모델의 설명가능성을 추구하는 훈련 데이터 속성 분석 연구

Study on Training Data Attribute Analysis for CNN Explainability

초록 (요약문)

현대 딥러닝의 발전과 함께 이미지 비전 문제들이 이전보다 현저하게 해결되었으나 더불어 모델의 내부 작동 원리를 명확히 설명하기 어려운 블랙박스 (black-box) 문제에 봉착하였으며 그 중 딥러닝 모델의 예측을 설명하기 위한 접근법으로 학습 데이터세트를 분석하여 모델의 간접적인 설명을 추구하는 TDA(Training Data Attribute) 방법론들이 제안되고 있고 이들 방법론은 높은 연산량과 연산 시간이 요구되는 한계가 있다. 이에 본 논문은 기존 TDA 방법론의 효율을 개선하고 연산량 및 연산시간을 감소시키면서도 학습 모델의 성능 향상 효과를 달성할 수 있는 새로운 방법을 제안한다. 구체적으로, CNN(Convolutional Neural Network) 모델을 활용한 이미지 분류 문제를 대상으로 모델 학습에 악영향을 미칠 수 있는 데이터를 TDA 분석을 활용하여 선별적으로 제거한 후 재학습을 통해 분류 정확도의 변화를 분석하였다. 제안하는 TDA 방법은 각 이미지 클래스별 손실(loss) 그라디언트를 추출한 후, PCA 기반의 2 차원 축소와 마할라노비스 거리 기반 3-시그마 한계선 탐지 기법을 결합하여 학습 데이터 내 이상치를 분류하는 방식을 적용하였다. 실험 결과, 약 5%의 비연관적 이미지 데이터로 구성된 음식 이미지 데이터세트(101 개 클래스)를 활용한 분석에서 본 연구의 방법론은 기존 TDA 대비 약 80% 이상의 분석 시간을 절감하였으며 분류 정확도는 TDA 전 후로 약 0.2% 향상되었다. 본 연구의 주요 기여는 TDA 의 효율화를 목표로 하여 기존 방법론 대비 훈련 데이터만을 활용한 분석 접근법으로 연산량과 분석 시간을 절감한 점에 있다.

more

초록 (요약문)

With advancements in modern deep learning, image vision tasks have been significantly improved compared to the past. However, alongside these developments, we encounter the black-box issue, where it remains challenging to clearly explain the internal workings of these models. In response, approaches like TDA (Training Data Attribute) have been proposed to indirectly interpret model predictions by analyzing the training dataset, yet these methods require substantial computational resources and processing time. This paper proposes an approach to improve the efficiency of existing TDA methodologies, aiming to reduce computational demands and processing time while maintaining analytical performance. Specifically, we applied our approach to an image classification task using a Convolutional Neural Network (CNN) model, where we selectively removed data that could adversely affect model training based on TDA analysis and subsequently retrained the model to observe changes in classification accuracy. Our proposed TDA method extracts loss gradients for each image class, combines PCA-based two-dimensional reduction, and applies the Mahalanobis’ distance based 3-sigma rule to detect outliers within the training data. Experimental results on a food image dataset comprising 101 classes, with approximately 5% unrelated image data, demonstrated that our method reduced analysis time by over 80% compared to conventional TDA methods and achieved 0.2% improvement in classification accuracy before and after TDA application. The main contribution of this study is the efficiency enhancement of TDA, achieved by using an analysis approach that relies solely on training data, reducing both computational requirements and analysis time compared to existing methods.

more

목차

제 1 장 서론 10
제 1 절 연구 배경 및 목적 10
제 2 절 연구 범위 및 구성 12
제 2 장 관련 연구 13
제 1 절 Influence function 13
제 2 절 TracIn 16
제 3 절 CAM(Class Activation Map) 18
제 3 장 제안 방법 19
제 1 절 관련 이론 19
(1) Convolutional Neural Network: Resnet-18 19
(2) PCA(Principal Component Analysis) 20
(3) Mahalanobis distance 22
제 2 절 Loss-Gradient PCA outlier detection 23
(1) 구상 동기(motive) 23
(2) TDA: Loss-Gradient PCA outlier detection 방법론 24
제 4 장 연구 실험 및 결과 25
제 1 절 데이터 소개 및 전처리 25
(1) 데이터 소개 25
(2) 데이터 전처리 25
제 2 절 모델 설계 및 실험 계획 26
(1) ResNet18 설계 26
(2) TDA 실험 계획 27
(2.1) TDA 훈련 27
(2.2) TDA 실험 29
제 3 절 실험 결과 30
(1) 3-classes 실험 결과 30
(1.1) Influence Function 결과 30
(1.2) TracIn 결과 33
(1.3) Loss-Gradient PCA outlier detection 결과 36
(1.4) 종합 결과 38
(2) 101-classes 실험 결과 40
(2.1) TracIn 결과 41
(2.2) Loss-Gradient PCA outlier detection 결과 43
(2.3) 종합 결과 44
제 5 장 결론 47
참고 문헌 48

more