검색 상세

Multi-Armed Bandit을 활용한 도로 환경에서의 5G 핸드오버 파라미터 최적화

Optimization of Handover Parameters in 5G Road Environments Using Multi-Armed Bandit

초록 (요약문)

5G 밀리미터파(mmWave) 네트워크는 고주파수 대역을 활용하여 기존 이동통신 기술보다 높은 데이터 전송 속도를 제공하는 차세대 이동통신 시스템이다. 그러나 높은 주파수 대역의 물리적 특성, 특히 심각한 경로 손실과 강한 직진성으로 인해 기지국의 서비스 영역이 매우 작고 불규칙적이어서 통신 품질의 안정성을 확보하기 어렵다. 도로 환경에서의 밀리미터파 통신은 이러한 특성에 높은 이동성이 더해져 통신 품질의 관리가 더욱 어려워진다. 단말의 높은 이동성과 주변 네트워크 환경의 복잡성은 빈번한 핸드오버를 유발하고 적절한 핸드오버 시점을 결정하기 어렵게 한다. 단말의 핸드오버 시점은 핸드오버 파라미터를 통해 결정된다. 핸드오버 파라미터는 핸드오버 발생 조건과 수행 시점을 조절하는 중요한 변수이다. 네트워크 환경에 맞는 적절한 핸드오버 파라미터를 선택하지 못하면 잘못된 핸드오버 결정이 일어날 수 있다. 기존의 고정 파라미터 핸드오버 방식은 주변 환경의 동적 변화에 적응하지 못하는 한계점을 가진다. 단말 이동 속도, 기지국 간 거리, 신호 세기 등 다양한 환경 변수를 고려하지 못하는 고정된 파라미터를 사용하기 때문에, 잘못된 핸드오버 결정을 내릴 가능성이 증가하고 결과적으로 가변적인 환경에 대해 최적의 성능을 보장할 수 없다. 이러한 문제를 해결하기 위해서는 핸드오버 파라미터를 네트워크 환경을 고려하여 최적화하는 접근법이 필요하다. 본 연구에서는 강화학습 기반의 Multi-Armed Bandit 문제를 활용하여 핸드오버 파라미터 Time-To-Trigger와 A3 임계값을 동적으로 최적화하는 방법을 제안한다. 제안 방법은 Neural UCB 알고리즘을 통해 기지국의 신호 세기와 단말의 이동성 등 주변 환경 정보를 학습하고, 이를 바탕으로 최적의 파라미터 조합을 탐색함으로써 환경 변화에 민감하게 대응하는 핸드오버 전략을 학습한다. 실험 결과, 제안된 방법은 네트워크의 안정성과 데이터 처리 성능을 동시에 개선하여 두 가지 측면에서 균형 잡힌 핸드오버 파라미터 최적화를 이루어냈다.

more

초록 (요약문)

5G millimeter-wave (mmWave) networks are next-generation mobile communication systems that utilize high-frequency bands to provide higher data transmission rates compared to existing mobile communication technologies. However, due to the physical characteristics of high-frequency bands, particularly severe path loss and strong line-of-sight propagation, base station service areas are extremely small and irregular, making it difficult to ensure communication quality stability. In road environments, millimeter-wave communication becomes even more challenging with the addition of high mobility. The terminal's high mobility and the complexity of surrounding network environments trigger frequent handovers and make it difficult to determine appropriate handover timing. Handover timing is determined through handover parameters. These parameters are critical variables that regulate handover occurrence conditions and execution moments. Failure to select appropriate parameters that match network environments can result in incorrect handover decisions. Existing fixed-parameter handover approaches have limitations in adapting to dynamic environmental changes. By using fixed parameters that do not consider various environmental variables such as terminal mobility, inter-base station distance, and signal strength, these methods increase the likelihood of incorrect handover decisions and consequently cannot guarantee optimal performance in variable environments. To address these issues, an approach is needed to optimize handover parameters by considering network environments. This research proposes a method using Reinforcement Learning-based Multi-Armed Bandit techniques to dynamically optimize handover parameters Time-To-Trigger and A3 Offset. The proposed method uses Neural UCB algorithms to learn surrounding environment information such as base station signal strengths and terminal mobility, and explores the optimal parameter combinations to develop handover strategies that sensitively respond to environmental changes. Experimental results show that the proposed method simultaneously improves network stability and throughput performance, achieving balanced handover parameter optimization.

more

목차

1 서론 1
2 제안 배경 4
2.1 5G 밀리미터파 통신 4
2.1.1 핸드오버 5
2.1.2 A3 이벤트와 핸드오버 파라미터 10
2.2 강화학습 12
3 관련 연구 14
4 제안 방법 17
4.1 핸드오버 파라미터 설정 17
4.2 핸드오버 파라미터 최적화 학습 과정 18
4.3 시나리오 21
5 실험 및 분석 22
5.1 시뮬레이션 환경 22
5.2 실험 결과 및 분석 24
5.3 한계 및 논의 33
6 결론 및 향후 연구 35
References 36

more