검색 상세

확장된 합성 곱 조합 신경망을 이용한 효과적인 의미론적 영상 분할

Effective Semantic Segmentation Using Dilated Convolution

초록/요약

최근 고성능 하드웨어의 등장과 빅데이터의 활용가능성 증가에 의해 딥러닝을 이용한 영상 분석에 관한 연구가 활발히 진행되고 있다. 그 중, 컴퓨터 비전 분야에서 가장 중요한 문제 중 하나인 영상 분할은 CNN의 등장으로 인해 빠른 속도로 발전하고 있다. 이러한 심층 합성 곱 신경망은 여러 단계의 합성 곱 연산과 풀링 과정을 거치는 형태로 구성되어 있다. 이 과정에서 점점 이미지의 특징 정보가 함축되어 특징 지도를 얻게 된다. 하지만 이는 픽셀 단위로 정교하게 의미 레이블을 표시해야 하는 객체 분할에는 필요한 정보가 많이 소실되어 적합하지 않다[1], [2]. 이러한 문제를 해결하기 위해 확장된 합성 곱 연산은 해상도의 손실을 없애기 위해 커널의 크기를 키워서 수용 영역의 크기를 확장하였다[5]. 의미 분할 분야에 있어서 확장된 합성 곱 커널과 확장된 합성 곱 커널들의 조합이 미치는 영향을 FCN, DeepLab-LargeFOV, DeepLab-ASPP모델들의 성능을 비교, 평가하여 알 수 있었다. 그리고 기존 모델의 3x3 크기의 커널들 중 수용 영역의 넓이가 큰 커널들은 제한된 파라미터의 개수를 가지기 때문에 유효한 특징들을 효과적으로 추출해내지 못함을 실험을 통해 검증하였다. 본 논문에서는 이 문제를 개선하기 위해 기존 모델의 3x3 크기의 커널들 중 확장 계수가 상대적으로 작은 커널들과 넓은 수용 영역에 적합한 5x5 크기의 커널들을 조합한 모델, 그리고 7x7 크기의 커널들을 조합한 모델들의 성능 비교를 통해 제안하는 모델이 기존 모델의 성능에 비해 0.8% 높은 성능을 보임을 실험을 통해 알 수 있었다.

more