검색 상세

3D 메모리를 이용한 효율적인 합성곱 신경망 가속기 구조 설계

ConvHMC: An efficient Convolutional Neural Network Accelerator with 3D memory

초록/요약

현대 인공지능 분야에서 높은 정확성을 갖는 딥 러닝 기술의 발전으로 다양한 딥 러닝 모델이 생기고 이미지 인식, 음성 인식, 의료 기기 등 여러 가지 분야에 영향을 미치고 있다. 특히 딥 러닝 모델 중 한 종류인 합성곱 신경망은 이미지 분야에서 큰 공헌을 이루었다. 그러나 합성곱 신경망 모델은 수백만-수천만 개의 파라미터로 이루어져 있기 때문에 기존의 범용 컴퓨터는 합성곱 신경망 모델을 수행함에 있어 어려움을 겪었다. 따라서 합성곱 신경망 연산에 특화된 여러 가지 딥 러닝 가속기가 등장하였다[1][2][3][5]. 그럼에도 불구하고 기존의 가속기는 더 낮은 에너지 소모와 더 빠른 수행 시간을 요구받는다. 이를 해결하기 위해 본 논문에서는 3D 메모리를 이용하여 더 낮은 에너지 소모와 더 빠른 수행 시간을 제공하는 합성곱 신경망 가속기 ConvHMC를 제안한다. ConvHMC는 기존의 딥 러닝 가속기와는 다르게 연산기의 활성도를 극대화할 수 있는 연산기 구조와 데이터 분할 방법을 이용하여 빠른 수행시간을 제공한다. 또한 DRAM 접근을 최소화하는 데이터 분할 방법과 레지스터를 이용한 데이터 재사용에 특화된 데이터 플로우를 통해 에너지 소모를 최소화한다. 종합적으로 ConvHMC는 기존의 3D 메모리를 이용한 딥 러닝 가속기인 TETRIS 보다 1.07배 낮은 에너지 소모와 1.23배 빠른 수행 시간을 가지며 확장성을 제공한다.

more

초록/요약

With the advancement of high-accuracy deep learning technology in the modern artificial intelligence field, various deep learning models have been coming and are affecting several fields such as image recognition, speech recognition, and medical devices. Especially, CNN(Convolutional Neural Network), a type of deep learning model, has made a great contribution in the image recognition field. However, since the CNN model consists of millions to tens of millions of parameters, conventional general-purpose computers have had difficulties in performing the convolutional neural network model. Therefore, various deep learning accelerators specialized for deep learning operations have appeared[1][2][3][5]. Nevertheless, conventional accelerators require lower energy consumption and faster execution time. To solve these problems, in this paper, we propose a CNN accelerator ConvHMC that provides lower energy consumption and faster execution time based on 3D memory. Unlike conventional deep learning accelerators, ConvHMC provides a faster execution time by proposing a processing structure and data partitioning method that can maximize the utilization of the processing elements. In addition, ConvHMC has lower energy consumption through a data partitioning method that reduced DRAM access and a data flow specialized for data reuse using registers. Overall, ConvHMC provides 1.07x lower power consumption and 1.23 x faster execution time than TETRIS, a conventional deep learning accelerator using 3D memory, and also have scalability.

more