보틀플리핑의 로봇 강화학습을 위한 효과적인 보상 함수의 설계
Designing an efficient reward function for robot reinforcement learning of the water bottle flipping task
- 주제(키워드) 로봇팔 , 강화 학습 , 모션 트랙킹 , 보틀 플리핑
- 발행기관 서강대학교 일반대학원
- 지도교수 이철수
- 발행년도 2018
- 학위수여년월 2018. 8
- 학위명 석사
- 학과 및 전공 일반대학원 기계공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000063289
- UCI I804:11029-000000063289
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
로봇은 다양한 산업현장에서 쓰이고 있으나 전통적인 조작 방식은 한계가 있다. 특히 로봇이 사물과 상호 작용하여 특정 목적을 수행하기 위해선 로봇과 사물의 관계를 정확한 수식으로 표현한 후 풀어야하는 어려움이 있다. 이러한 한계로 인하여 로봇은 아직까지 고정된 위치에서 반복적인 목적 수행에 적합하기 때문에 이를 해결하기 위해 로봇 강화 학습은 활발히 연구되고 있는 분야이다. 본 연구에서는 강화 학습(Reinforcement Learning)을 로봇에 적용하여, 전통적인 방식으로 해결하기 어려운 문제를 로봇 스스로가 학습하여 풀어나가는 과정과 결과를 기술한다. 로봇이 수행할 임무는 액체가 든 물병을 던져 바닥에 세우는 놀이인 bottle flipping이다. 본 논문은 우선 로봇이 물병을 던지는 사람의 행위를 image tracking으로 모사한 후, 모사한 행동을 강화 학습을 통해 개선하기 위한 효과적인 보상 함수를 설계하는 과정을 중점적으로 기술한다.
more초록/요약
Robots are used at various industrial sites, but traditional methods of operation are limited. In particular, in order for a robot to interact with an object and accomplish a particular purpose, it has to express the relationship between the robot and the object in an accurate formula and solve it. Due to these limitations, robot reinforcement learning is an area that is actively studied to overcome such limitations. In this study, a robot solves a complex problem based on reinforcement learning. The robot's mission is to throw a liquid water bottle to the floor and land it upright on its bottom. This paper first describes the robot's image tracking of the person who throws the water bottle and then the process of designing an effective reward function of reinforcement learning to succeed given task.
more

