검색 상세

Elastic Stack과 ChatGPT를 이용한 웹 로그 침입 탐지 시스템 설계 및 구현

Design and Implementation of a Web Log Intrusion Detection System Using Elastic Stack and ChatGPT

초록 (요약문)

정보보안은 현대 사회에서 기업과 개인에게 중요한 이슈로 부상하였고, 웹 로그 분석은 이러한 사이버 보안 환경에서 기업의 보안 전략 핵심 요소로 활용되고 있다. 보안 체계가 부족한 환경에서 웹 로그 분석은 웹 서버를 대상으로 한 보안 위협 흔적을 찾는데 활용되며, 보안 체계가 잘 구축된 경우라도 보안 솔루션의 룰에 부합하지 않아 탐지되지 못한 공격을 보완하는데 중요한 역할을 한다. 웹 서비스 확장에 따른 로그 데이터 증가와 공격 유형의 다양화는 분석에 대한 빅데이터 솔루션 수요를 상승시켰다. 하지만, 보안 전문가의 수는 고정된 상태에서 로그 데이터의 양은 계속해서 늘어나고 있고 분석 시간 또한 증가함에 따라 보안 위협을 감지하지 못하는 문제가 발생하게 된다. 최근에는 AI(Artificial Intelligence) 기반의 자동화 솔루션 및 관련 연구가 활발하게 진행되고 있지만, AI로 성과를 내기까지는 상당한 시간이 소요되며, AI 보안 시스템 구축 시 데이터 확보, 전문가 확보, 시스템 구축 및 유지 비용 등 다양한 제약 사항들이 존재한다. 본 논문에서는 AI 보안 시스템 구축이 어려운 환경이거나 보안 체계가 부족한 환경 또는 보안 체계 구축이 잘 되어 있으나 대량의 웹 로그에서 비정상 통신에 대한 분석이 필요한 환경에서 분석의 효율성을 향상시키고 자동화를 통해서 비용 및 분석 시간 절감을 목표로 한다. 이를 위해 오픈소스 빅데이터 솔루션인 ELK Stack(Elasticsearch, Logstash, Kibana)과 OpenAI사의 대화형 인공지능 대규모 언어 모델인 ChatGPT를 이용하여 웹 로그 침입 탐지 분석 자동화 시스템을 구현하고 효과성을 검증하여 실제 업무 적용 가능성과 GPT 모델의 성능을 평가하고자 한다.

more

초록 (요약문)

Information security has risen to the forefront as a significant concern for both businesses and individuals in modern society. In this cyber security landscape, web log analysis has become an integral part of corporate security strategies. In situations where security infrastructure is lacking, web log analysis serves as a vital tool for discovering traces of security threats targeting web servers. Furthermore, it plays an essential role in identifying attacks that go unnoticed due to non-compliance with security solution rules, even in environments with well-established security measures. With the expansion of web services, both the increase in log data and diversification of attack patterns have spurred the demand for big data solutions for analysis. However, a problem arises as the amount of log data continually grows and the time for analysis increases, while the number of security professionals remains constant. Recent efforts have seen a surge in AI-based automated solutions and associated research. Yet, achieving meaningful outcomes with AI entails considerable time and is subject to several constraints, including data collection, specialist recruitment, and costs associated with system construction and maintenance. This paper aims to enhance analysis efficiency and reduce both costs and analysis time through automation in environments where AI security system implementation is challenging, where the security system is inadequate, or where there is a need for analysis of abnormal communication in voluminous web logs, even in contexts where security measures are robust. To achieve this, we utilize the open-source big data solution, ELK Stack (Elasticsearch, Logstash, Kibana), and OpenAI's conversational AI large language model, ChatGPT, to develop an automated web log intrusion detection analysis system. We aim to validate its effectiveness and assess the practical application potential as well as the performance of the GPT model.

more