검색 상세

이상치 탐지를 위한 형체 정보 기반의 계층형 VAE 구현

A hierarchical shape-aware variational autoencoder for anomaly detection

초록 (요약문)

본 논문에서는 이상치 탐지를 위한 준지도 학습 방식의 VAE 구조를 제안한다. VAE의 인코딩 과정에서 정보의 손실과 변형 발생은 복원 화질 저하 및 왜곡으로 이어진다. 잘못된 복원으로 인한 이상치 탐지의 실패를 줄이기 위해 계층적 VAE를 사용하여 복원의 화질을 개선하고, 깊어진 계층으로 불안정해진 학습은 양방향성 encoder에 skip connection을 적용하여 두 encoder가 생성하는 분포를 유사하게 만들어 안정된다. 또한 skip connection의 사용으로 증가하는 misalign 복원 위험을 완화하기 위해 형태 정보에 집중하는 잠재 변수 형성을 학습한다. 하지만 복원 성능이 개선되어도 이상치 판단을 위해 VAE의 입력과 출력의 차이만을 사용한다면 국부적인 특성에 집중하여 질감의 변화와 같은 전반적인 특성 변화는 감지하지 못한다. 이를 해결하기 위해 상향성 encoder에서 나오는 다중 스케일 특징 맵에서 비정상적인 패턴이 보이는 차원을 선택적으로 모아 마스크를 생성하고 추론에 함께 사용한다. 제안한 방법은 생성 모델을 사용한 최신 이상치 탐지 방법들과 MVtec-AD와 MTD 데이터셋에 대한 이상치 탐지 결과를 비교하여 우수한 탐지 성능 및 빠른 수행 속도를 보인다. 또한 ablation study를 통해 제안한 기법들에 대한 효용성을 입증한다.

more

초록 (요약문)

A VAE-based architecture for anomaly detection with semi-supervised learning is proposed in this thesis. The VAE with a hierarchical structure aims to alleviate the limitation of reconstruction-based anomaly detection, which is securing not only reconstructed image quality but also tolerance to variance in shape. We introduce a novel approach for dealing with the misaligned reconstruction problem often caused by skip connections introduced between the bottom-up encoder and the top-down encoder of VAE for stabilizing training. In our implementation, a sub-network for mask extraction and a set of shape-aware loss terms play a key role as the VAE is trained with not only normal images but also anomalous ones synthesized from the normal images to learn a joint reconstruction-anomaly embedding. A set of experiments shows that the proposed architecture outperforms reconstruction-based anomaly detection approaches recently presented in the literature, in terms of not only the detection accuracy but also the execution speed. And the ablation study proves the effectiveness of each of the proposed functional modules.

more