CTGAN기반의 오버 샘플링 기법을 이용한 침입 탐지 데이터의 불균형 문제 개선 방안에 관한 연구
A Study on an Improvement of the Imbalance Problem in Intrusion Detection Data using Oversampling based on CTGAN
- 발행기관 서강대학교 정보통신대학원
- 지도교수 오경환
- 발행년도 2020
- 학위수여년월 2020. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 정보보호
- UCI I804:11029-000000065283
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
기존의 기계 학습 연구는 다양한 특징 선택과 모델을 이용하여 테스트 데이터셋의 예측력을 향상시키는 것을 목표로 하고 있다. 하지만 네트워크 공격은 시스템 및 네트워크의 환경과 공격에 사용되는 도구 등에 의해 달라질 수 있으므로, 학습 모델을 실제로 활용하는데 한계가 있다. 또한 정상 패킷에 비해서 공격 패킷이 극도로 적은 데이터의 특징도 고려해야 할 요소이다. 이러한 불균형 문제를 해소하기 위해서 기존의 연구는 SMOTE 알고리즘에 기반한 다양한 오버 샘플링에 힘써왔다. 그러나 최근 몇년간은 새로운 합성 데이터를 생성해 낼 수 있는GAN 알고리즘에 대한 연구가 활발하다. 본 연구에서는 GAN알고리즘에 기반한 CTGAN기법을 이용하여 구조화 데이터의 합성 샘플을 생성하고, 이에 대한 성능을 전통적인 방법들과 비교한다. 더 나아가서, 기존 데이터 셋이 아닌 유사 공격을 발생 시켜, 학습 된 모델의 실제 응용 가능성까지 확인한다.
more