확장된 합성 곱 조합 신경망을 이용한 효과적인 의미론적 영상 분할
Effective Semantic Segmentation Using Dilated Convolution
- 주제(키워드) Dilated convoution , Semantic Segmentation
- 발행기관 서강대학교 일반대학원
- 지도교수 박운상
- 발행년도 2019
- 학위수여년월 2019. 8
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000064362
- UCI I804:11029-000000064362
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권보호를 받습니다.
초록/요약
최근 고성능 하드웨어의 등장과 빅데이터의 활용가능성 증가에 의해 딥러닝을 이용한 영상 분석에 관한 연구가 활발히 진행되고 있다. 그 중, 컴퓨터 비전 분야에서 가장 중요한 문제 중 하나인 영상 분할은 CNN의 등장으로 인해 빠른 속도로 발전하고 있다. 이러한 심층 합성 곱 신경망은 여러 단계의 합성 곱 연산과 풀링 과정을 거치는 형태로 구성되어 있다. 이 과정에서 점점 이미지의 특징 정보가 함축되어 특징 지도를 얻게 된다. 하지만 이는 픽셀 단위로 정교하게 의미 레이블을 표시해야 하는 객체 분할에는 필요한 정보가 많이 소실되어 적합하지 않다[1], [2]. 이러한 문제를 해결하기 위해 확장된 합성 곱 연산은 해상도의 손실을 없애기 위해 커널의 크기를 키워서 수용 영역의 크기를 확장하였다[5]. 의미 분할 분야에 있어서 확장된 합성 곱 커널과 확장된 합성 곱 커널들의 조합이 미치는 영향을 FCN, DeepLab-LargeFOV, DeepLab-ASPP모델들의 성능을 비교, 평가하여 알 수 있었다. 그리고 기존 모델의 3x3 크기의 커널들 중 수용 영역의 넓이가 큰 커널들은 제한된 파라미터의 개수를 가지기 때문에 유효한 특징들을 효과적으로 추출해내지 못함을 실험을 통해 검증하였다. 본 논문에서는 이 문제를 개선하기 위해 기존 모델의 3x3 크기의 커널들 중 확장 계수가 상대적으로 작은 커널들과 넓은 수용 영역에 적합한 5x5 크기의 커널들을 조합한 모델, 그리고 7x7 크기의 커널들을 조합한 모델들의 성능 비교를 통해 제안하는 모델이 기존 모델의 성능에 비해 0.8% 높은 성능을 보임을 실험을 통해 알 수 있었다.
more

