패치 임베딩과 데이터증강을 이용한 단일 클래스 분류기반 이상치 탐지
Anomaly detection based on one-class classification using patch embedding and data augmentation
- 주제어 (키워드) 심층신경망 , 단일 클래스 분류 , 데이터 증강 , 이상치 탐지 , 결함 탐지 , 객체 위치 식별; Deep learning , One class classification , Data augmentation , Anomaly detection , Defect Detection , Object Localization
- 발행기관 서강대학교 일반대학원
- 지도교수 양지훈
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 일반대학원 인공지능학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000079007
- UCI I804:11029-000000079007
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
이상 탐지(Anomaly detection)란 주어진 특정 데이터 분포에서 다소 벗어난 형 태의 데이터 패턴을 찾아내는 것을 목표로 연구하는 학문이다. 이상 탐지는 질병을 예측하거나, 사기 거래 및 네트워크에서 발생하는 이상 징후를 탐지, 불량품을 조기 선별하는 등 다양한 분야에서 활용되고 있다. 사람은 이상을 탐지할 때 기억을 사용한다. 정상적인 데이터 패턴을 기억하고 추 후 입력된 패턴이 정상에 벗어나는 패턴이라면 이를 비정상 데이터라고 분류하게 된다. 이러한 사람의 이상탐지 방법을 응용한 기법으로 메모리뱅크가 있다. 이는 정 상 데이터 패턴을 메모리뱅크에 저장해 두고 추론 시 얼마나 유사한지를 거리로 판 단하여 이상탐지를 수행한다. 메모리뱅크를 활용한 대표적인 이상탐지 방법으로 패 치코어(Patchcore)가 있다. 이는 이미지 넷으로 사전 학습한 심층신경망을 활용하 여 특징 맵을 추출하여 임베딩하고 이를 메모리뱅크에 저장하여 이상치탐지에 사용 한다. 이 방법은 MVTec-AD 데이터 셋에서 매우 높은 성능을 보여주고 있다. 하지만 이 방법에는 두 가지 문제점이 있다. 첫 번째 문제점으로 추론이 오래 걸 린다. 메모리뱅크 기반 이상탐지는 유사도 측정을 위해 거리 계산을 수행하기 때문 이다. 두 번째 문제점은 정상 임베딩 벡터간의 분산이 크다. 그 이유는 임베딩 벡터 를 추출할 때 사용하는 심층신경망 모델은 일반 이미지로 학습되었는데 이는 사용 하고자 하는 산업 이미지와는 다른 특징을 갖기 때문이다. 본 논문에서는 언급한 문제점을 개선하기 위하여 단일 클래스 분류 기반의 이상 치 탐지 방법을 제안한다. 이미지 넷으로 사전 학습한 심층신경망을 활용하여 생성 한 임베딩 벡터의 표현을 산업 데이터에 적절하도록 변환하기 위해 표현 계층을 추 가하였다. 그리고 Patch-Exchange와 Patch-Cutpaste라는 비정상 데이터 생성 기법을 활용하여 비정상 데이터를 생성하고 이를 다중 클래스 분류라는 프록시 태 스크로 모델을 생성한다. 그리고 그 모델에 단일클래스 분류를 적용하여 이상탐지 를 수행한다. 제안하는 방법은 MVTEC-AD에서 패치코어와 비슷한 성능을 보여주 었으며, 매우 빠른 추론 성능을 보여주었다.
more초록 (요약문)
Anomaly detection refers to the field aimed at identifying data patterns that deviate somewhat from a given specific data distribution. Anomaly detection is widely used for predicting diseases, detecting fraudulent transactions and abnormal signs in networks, and early screening of defective products. Humans can detect anomalies through memory. If one remembers normal data patterns, any subsequent altered data patterns can be classified as anomalies. This memory based approach is known as memory bank based anomaly detection. It involves storing normal data patterns in a memory bank and determining the similarity during inference by calculating the distance. A representative anomaly detection method using a memory bank is PatchCore. PatchCore utilizes a pre-trained model on ImageNet to extract feature maps in patch units, storing these into a memory bank to detect anomalies. It has shown very high performance on the MVTec-AD dataset. However, this method has two issues. First, inference takes a long time due to the memory bank-based anomaly detection relying on distance. Second, the dataset that generated the pre-trained model, ImageNet, consists of general images, which differ from industrial datasets like MVTec-AD. This difference causes a distribution spread in normal features extracted from the same location, leading to significant deviations among normal product images. In this paper, to improve upon the aforementioned issues, we propose an anomaly detection method based on one-class classification. By training the embedding vectors generated from a pre-trained model with Patch SVDD method, we reduced the variance among similar patch features. We also propose anomaly data augmentation techniques called Patch-Exchange and Patch-CutPaste. Using these and a model trained with multi-class classification of normal training images, we performed anomaly detection. This method demonstrated similar performance compared to memory bank-based methods on the MVTec-AD dataset and achieved significantly faster inference performance.
more목차
제 1 장 서론 1
1.1 연구 배경 ·1
1.2 논문의 구성 4
제 2 장 관 련 연 구 5
2.1 이상 탐지 ·5
2.1.1 재 복원 기반 이상 탐지 6
2.1.2 분류 기반 이상 탐지 6
2.1.3 임베딩 기반 이상 탐지 7
제 3 장 패치 임베딩과 데이터 증강을 이용한 이상치 탐지 10
3.1 네트워크 구조 10
3.1.1 생성 계층 11
3.1.2 임베딩 계층 12
3.1.3 표현 계층 13
3.1.4 판단 계층 · 15
3.2 이상치 점수 ·16
3.3 추론 과정 17
제 4 장 실험 및 결과 18
4.1 실험 방법 18
4.1.1 데이터 셋 18
4.1.2 실험 설정 19
4.1.3 평가방법 19
4.2 실험 결과 20
4.2.1 이미지 단위 평가 ·20
4.2.2 픽셀 단위 평가 22
4.2.3 추론 속도 23
4.3 비정상 데이터 생성과 임베딩 벡터 시각화 24
4.3.1 비정상 데이터 생성 결과 시각화 24
4.3.2 표현 계층 임베딩 벡터 시각화 ·24
4.4 입증 실험 27
4.4.1 비정상 데이터 학습 효과 검증 ·27
4.4.2 표현 계층의 효과 검증 28
4.4.3 표현 계층에 사용된 목적함수의 효과 검증 29
제 5 장 결론 및 토의 30
참 고 문 헌 ·31