대형서버 기반 복합 솔루션 시스템을 위한 모니터링 시스템 구현 : An implementation of Monitoring system for complex solutions system on a large-scale server
- 발행기관 서강대학교 정보통신대학원
- 지도교수 박수용
- 발행년도 2008
- 학위수여년월 2008. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원
- 식별자(기타) 000000108545
- 본문언어 한국어
목차
현대에 구현되는 정보 시스템은 단일 인프라로 구성되지 않고, 대형 서버기반에 수많은 기능을 수행하는 솔루션(시스템 S/W)들이 함께 구현되고 있고, S/W의 개발 이후의 유지보수의 중요성이 강조되고 있으나, S/W 유지보수에 대한 연구는 개발에 비하여 적고, 시스템을 구성하는 또 다른 부분인 Infrastructure에 대한 유지보수에 대한 연구는 더욱 적은 현실이다. 이에 현재 진행되고 있는 유지보수 프로젝트의 현실을 분석하여 정보시스템 유지보수에서 모니터링의 필요성을 도출하였고, 이에 모니터링 시스템의 상용화된 제품에 대하여 분석하였으나, 제품으로 상용화된 모니터링 시스템은 다양한 정보를 볼 수 있고, 화려한 화면을 제공하나, 비용이 크고, 특정 기술에 한정된 경우가 많고, 부하가 많이 발생할 수 있다.
본 논문에서는 이러한 정보시스템의 Infrastructure의 유지보수 업무 중 장애관리를 지원할 수 있는 모니터링 시스템을 제안하였다. 구현한 모니터링 시스템은 여러 엔지니어의 다양한 경험을 바탕으로 큰 장애로 이어질 수 있는 단순한 장애들을 인지할 수 있다. 통합적인 관점에서의 장애 포인트를 선별하여, 점검할 수 있도록 시스템을 개발하였고, 모니터링 업무 수행자가 개인 PC에서 장애 현황을 확인할 수 있는 기능과 조치할 때 참고 할 수 있는 경험기반의 Knowledge를 참고할 수 있는 기능을 함께 제공하였다. 이 모니터링 시스템을 업무에 적용하여 성능을 분석하였을 때 업무의 장애 발생률이 13% 감소를 확인하였고, 타 시스템 대비 부하가 크지 않으며, 통합적으로 장애를 인지할 수 있고, 확장성의 용이 등 여러 가지 강함을 증명하였다.
목차
Nowadays, IT Systems are implemented not only single infrastructure but also multi infrastructure which are large servers with various solutions. After S/W development, S/W maintenance is very important but S/W maintenance research funds are smaller than S/W development research funds and infrastructure, which is a part of system structure, maintenance research funds are much smaller than others. This thesis analyzes circumstances of S/W maintenance project and finds the needs of monitoring system. However, a commercial monitoring system give various information and good looking UI, but it is high price, some technology dependent, and use lots of H/W resources.
This thesis suggests a monitoring system, which can detects small failure that can cause a big failure, based on various experiences of engineers. This monitoring system are developed to check a failure point in a integrated view, a monitoring person can check a failure on his PC and gives references and knowledge which can use when he solves the problem. This system reduce 13% of failure, use small portion of H/W resources, easy to detect failure, and easy to extend than other solutions when it is applied.

