검색 상세

강화 학습과 다기준 의사 결정 방법을 활용한 무선 센서 네트워크 성능 향상 기법

A new Sensor Network Efficiency Control Scheme based on the Multi-Criteria Reinforcement Learning Approach

초록 (요약문)

본 연구에서는 다기준 의사 결정 방법을 무선 센서 네트워크의 에너지 소비 효율과 데이터 전송량을 동시에 향상시키기 위한 기법을 제안한다. 전력 공급이 제한되는 무선 센서 네트워크에서 각 센서 노드가 동적으로 자신의 데이터 수집 주기를 조절하여 에너지 소비 효율과 데이터 수집량을 동시에 향상시킬 수 있도록 하는 것을 목표로 한다. 이 문제를 해결하기 위해 본 논문에서는 다기준 의사 결정 방법 중 하나인 TOPSIS(Technique for Order of Preference by Similarity to Ideal Solution)와 강화 학습의 방법 중 하나인 Q-러닝(Q-Learning)을 결합한 TOPSIS-AL(TOPSIS - Adaptive Learning) 기법을 제안한다. 본 논문에서는 기존의 다기준 의사 결정 방법이 결정론 적으로 단 하나의 해결책을 제시하는 것과 다르게, 확률적으로 여러 개의 해결책을 동시에 제시한다는 점에서 차별점이 존재한다. 또한, 엔트로피 가중치 방법을 통해 각 센서 노드가 현재 자신의 상황에서 두 가지 기준(에너지 소비 효율, 데이터 수집량)의 가중치를 스스로 결정하게 함으로써 가중치 산정 과정을 자동화했다. 실험을 통해 TOPSIS-AL 기법을 기존의 자기 적응 기법과 Q-러닝 기법에 비교한 결과, 학습 횟수에 따른 센서 노드의 평균 에너지 수준, 센서 노드의 평균 누적 데이터 전송량, 센서 노드의 평균 에너지 소비 효율을 포함한 총 5가지 평가 지표에 대해 TOPSIS-AL 기법이 기존의 기법들보다 더 우수한 성능을 보임을 입증했다.

more

목차

제 1 장 서론 1
제 2 장 관련 연구 6
제 3 장 배경 지식 11
3.1 강화 학습 11
3.2 Q 러닝(Q-Learning) 15
3.3 다기준 의사 결정 방법과 TOPSIS 16
3.4 엔트로피 가중치 산정 방법 23
제 4 장 제안 기법 25
4.1 문제 상황 모델링 25
4.2 에이전트 & 의사 결정자 28
4.3 행동 & 대안 28
4.4 상태 29
4.5 보상 29
4.6 정책 30
4.7 수렴 30
4.8 의사 결정 행렬 31
제 5 장 성능 평가 33
5.1 실험 환경 구성 33
5.2 제안 기법 성능 분석 36
제 6 장 결론 42
참고 문헌 43

more