센서별 시간지연 교차 상관관계를 적용한 GCN 기반의 다변량 시계열 데이터 이상 탐지 기법
GCN-based Multivariate Time Series Data Anomaly Detection Method with Sensor-specific Time Lagged Cross Correlation
- 주제어 (키워드) 시간지연 교차 상관관계 , GCN , 다변량 시계열 데이터 이상탐지
- 발행기관 서강대학교 일반대학원
- 지도교수 정성원
- 발행년도 2023
- 학위수여년월 2023. 2
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000069875
- UCI I804:11029-000000069875
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
네트워크 관리/보안, 산업현장 등에서는 각 센서가 수집하는 시계열 데이터를 통해 장비를 모니터링을 한다. 따라서 효율적인 시계열 데이터 이상 탐지를 통해 조기에 장비 이상을 탐지하는 것은 더 큰 피해를 방지하고 생산성 향상에 기여할 수 있기 때문에 해당 분야에서는 매우 중요한 과제이다. 최근 딥러닝이 발전하며 시계열 데이터 이상 탐지에 관한 연구가 활발히 진행되고 있지만, 다음과 같은 제약사항들이 있다. 첫째, 다른 센서와의 상관관계를 분석하지 않고 각 센서의 이상 유무만을 분석하기 때문에 불필요한 허위 알람이 발생한다. 둘째, 센서별 상관관계를 분석하기 위해 완전 그래프로 모델링하고 GAT(Graph Attention Networks)를 적용하였으나, 이 방식은 정확한 상관관계를 반영할 수 없고, 불필요한 연산의 증가로 매우 많은 분석 시간이 소요된다. 본 논문에서는 이 문제를 해결하기 위해 SC-GCNAD(Sensor-specific Correlation GCN Anomaly Detection)를 제안한다. SC-GCNAD는 상기의 제약사항들을 해결하기 위해 시계열 데이터의 특징을 반영한 TLCC(Time Lagged Cross Correlation)를 적용하여 유의미한 센서별 상관관계를 분석하고, 모델 표현력이 뛰어난 GCN(Graph Convolutional Networks)을 활용한다. 또한 SC-GCNAD는 준지도학습 기반 이상 탐지 기법을 적용하기 때문에 정상 데이터로만 학습한다. 정상 데이터는 일정한 범위 안에서 존재하거나 반복되는 패턴을 가지고 있으므로 기존의 방식처럼 Time Stamp를 ‘1’씩 증가하며 학습이 된다면 중복되는 패턴과 데이터로 인해 불필요한 연산량이 많아지게 된다. 따라서 학습데이터에 Stride를 적용하여 분석 시간을 단축한다. 그 결과 핵심적인 상관관계만 반영한 그래프 구조로 변환하여 분석 시간을 단축하며, 이후 GRU와 예측 모델을 통해 시계열 데이터 내 이상치를 탐지한다. SC-GCNAD는 기존 모델 대비 F1-Score는 최대 6.37% 향상하고, 분석 시간은 최대 95.31% 단축한다.
more초록 (요약문)
In network management/security, industrial sites, equipment is monitored through time series data collected by each sensor. Therefore, early detection of equipment anomalies through efficient time series data anomaly detection is a very important challenge in the field because it can prevent further damage and contribute to productivity improvement. With the recent development of deep learning, research on time series data anomaly detection is being actively conducted, but there are the following restrictions. First, unnecessary false alarms occur because only abnormalities of each sensor are analyzed without analyzing the correlation with other sensors. Second, although complete graph modeling and GAT(Graph Attention Networks) were applied to analyze the correlation of each sensor, this method cannot reflect the exact correlation and requires a lot of analysis time due to the increase in unnecessary operations. In this paper, we propose SC-GCNAD(Sensor-specific Correlation GCN Anomaly Detection) to address this problem. SC-GCNAD analyzes the exact correlation of each sensor by applying TLCC(Time Lagged Cross Correlation) that reflects the characteristics of time series data to solve the above limitations, and utilizes GCN(Graph Convolutional Networks) with excellent model expressiveness. In addition, SC-GCNAD learns only from normal data because it applies the Semi-Supervised Anomaly Detection technique. Since normal data exists within a certain range or has repeated patterns, the time stamp is increased by ‘1’ as in the conventional method, and if it is learned, the redundant patterns and data increase unnecessary computation. Therefore, the analysis time is shortened by applying stride to the learning data. As a result, the analysis time is shortened by converting only the core correlation into a graph structure, and outliers in the time series data are detected through GRU and Forecasting models. SC-GCNAD improves F1-Score by up to 6.37% and reduces analysis time by up to 95.31%.
more