로봇 골프 트롤리의 자율주행을 위한 딥러닝 세그멘테이션 네트워크를 활용한 골프장 그린 검출 방법 및 정확도 향상 연구
Research on Golf Course Detection Method and Accuracy Enhancemnet using Deep Learning Segmentation Network for Autonomous Robot Golf Trolley
- 주제어 (키워드) 딥러닝 , 세그멘테이션 , 골프 , 로봇 , 트롤리 , 자율주행 , Deep Learning , Segmentation , Golf , Robot , Trolley , Autonomous Mobility
- 발행기관 서강대학교 정보통신대학원
- 지도교수 이주호
- 발행년도 2023
- 학위수여년월 2023. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000076380
- UCI I804:11029-000000076380
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
국외 골프장은 굳이 카트에 탑승하지 않아도 불편하지 않아 카트와 캐디를 이용하지 않기도 한다. 2018년 코로나 팬데믹 전후로 이들을 겨냥한 골프 트롤리들이 많이 개발되고 있다. 그러나 아직 시중에 장애물 회피나 홀 간 이동 등 자율주행 요소들이 도입되어 골퍼들의 사용 편의성이 극대화된 트롤리는 없다. 따라서 자율 주행이 가능한 로봇 골프 트롤리를 개발하면, 관련 시장에 새로운 지평을 열 수 있는 기회이다. 트롤리에는 GPS, IMU, 초음파, UWB 등 다양한 센서들이 탑재되어 있지만, 주로 카메라 센서를 통해 입력 받는 영상이 주행에 가장 많은 영향을 끼친다. 트롤리는 딥러닝 추론을 통해 반환되는 픽셀 좌표계의 결과값을 지령으로 받아 주행하도록 설계하였다. 이와 관련된 딥러닝 과제는 다음과 같다. 첫번째로 카메라 상으로 소유주를 포착하고, 피해야 할 물체들을 피하면서 따라가기 위해 Object detection 모델들이 탑재되었다. 두번째로는 그린, 벙커 등 필드에서 트롤리가 들어갈 수 없는 영역들을 판단하고 우회하기 위해 Semantic 세그멘테이션 모델이 탑재되었다. 그러나 어떠한 이유에서 인지 세그멘테이션 모델의 추론 결과가 굉장히 불안정하다는 것을 확인하였다. 본 논문은 컴퓨팅 자원의 제약으로 딥러닝 모델의 선택지가 제한된 상황에서,과제 해결을 위해 가용할 수 있는 모델의 특성을 발굴하고, 성능을 제고하기 위한 방법을 연구하였다. 여러 딥러닝 네트워크의 특성 비교를 통해 ROI(Region Of IInterest) 계산의 유무가 그린처럼, 대상의 일부분만이 카메라에 각기 다른 크기와 모양으로 포착되는 지형지물의 세그멘테이션 성능에 영향을 끼칠 것이라고 가설을 설립하였고, 이를 토대로 서로 구분되는 특징을 갖고 있는 두 모델을 정량적, 정성적으로 비교하고 실험함으로써 성능의 개선을 확인하였다. 나아가, 세그멘테이션 성능을 제고하기 위해서 고려할 수 있는 데이터 증강 방법도 제안하고자 한다.
more초록 (요약문)
Autonomous golf trollies have gained popularity in overseas golf courses, providing convenience to golfers without the need for carts or caddies. However, existing trollies lack autonomous driving capabilities, such as obstacle avoidance and navigation between holes, to maximize user convenience. Therefore, the development of a self-driving robot golf trolley could be sensational to golfers. The trolley is equipped with various sensors, including GPS, IMU, ultrasound, and UWB, but video input received through camera sensors has the most significant impact on driving. The trolley is designed to receive command signals based on pixel coordinates through deep learning inference. The deep learning tasks related to this are as follows. First, object detection models are installed to capture the owner on camera and avoid objects that need to be avoided. Second, semantic segmentation models are installed to judge and bypass areas on the field, such as the green and bunkers, where the trolley cannot enter. However,it was confirmed for some reason that the inference results of the segmentation model were very unstable. This paper describes the characteristics of available models and investigates methods to enhance performance in situations where the choice of deep learning models is constrained due to limited computing resources. Based on a comparison of the characteristics of various deep learning networks, the presence or absence of ROI (Region Of Interest) calculations would affect the segmentation performance of topographical features that are captured by cameras in different sizes and shapes, such as greens. Based on this hypothesis, two models with distinct features are quantitatively and qualitatively compared and experimented to verify the performance improvements. Furthermore, this paper proposes data augmentation methods that can be considered to enhance segmentation performance.
more