강화 학습과 다기준 의사 결정 방법을 활용한 무선 센서 네트워크 성능 향상 기법
A new Sensor Network Efficiency Control Scheme based on the Multi-Criteria Reinforcement Learning Approach
- 발행기관 서강대학교 일반대학원
- 지도교수 김승욱
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000079164
- UCI I804:11029-000000079164
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
본 연구에서는 다기준 의사 결정 방법을 무선 센서 네트워크의 에너지 소비 효율과 데이터 전송량을 동시에 향상시키기 위한 기법을 제안한다. 전력 공급이 제한되는 무선 센서 네트워크에서 각 센서 노드가 동적으로 자신의 데이터 수집 주기를 조절하여 에너지 소비 효율과 데이터 수집량을 동시에 향상시킬 수 있도록 하는 것을 목표로 한다. 이 문제를 해결하기 위해 본 논문에서는 다기준 의사 결정 방법 중 하나인 TOPSIS(Technique for Order of Preference by Similarity to Ideal Solution)와 강화 학습의 방법 중 하나인 Q-러닝(Q-Learning)을 결합한 TOPSIS-AL(TOPSIS - Adaptive Learning) 기법을 제안한다. 본 논문에서는 기존의 다기준 의사 결정 방법이 결정론 적으로 단 하나의 해결책을 제시하는 것과 다르게, 확률적으로 여러 개의 해결책을 동시에 제시한다는 점에서 차별점이 존재한다. 또한, 엔트로피 가중치 방법을 통해 각 센서 노드가 현재 자신의 상황에서 두 가지 기준(에너지 소비 효율, 데이터 수집량)의 가중치를 스스로 결정하게 함으로써 가중치 산정 과정을 자동화했다. 실험을 통해 TOPSIS-AL 기법을 기존의 자기 적응 기법과 Q-러닝 기법에 비교한 결과, 학습 횟수에 따른 센서 노드의 평균 에너지 수준, 센서 노드의 평균 누적 데이터 전송량, 센서 노드의 평균 에너지 소비 효율을 포함한 총 5가지 평가 지표에 대해 TOPSIS-AL 기법이 기존의 기법들보다 더 우수한 성능을 보임을 입증했다.
more목차
제 1 장 서론 1
제 2 장 관련 연구 6
제 3 장 배경 지식 11
3.1 강화 학습 11
3.2 Q 러닝(Q-Learning) 15
3.3 다기준 의사 결정 방법과 TOPSIS 16
3.4 엔트로피 가중치 산정 방법 23
제 4 장 제안 기법 25
4.1 문제 상황 모델링 25
4.2 에이전트 & 의사 결정자 28
4.3 행동 & 대안 28
4.4 상태 29
4.5 보상 29
4.6 정책 30
4.7 수렴 30
4.8 의사 결정 행렬 31
제 5 장 성능 평가 33
5.1 실험 환경 구성 33
5.2 제안 기법 성능 분석 36
제 6 장 결론 42
참고 문헌 43