3D-CNN과 타일 피처 맵을 이용한 고해상도 뇌졸중 혈전 사진 분류 방법
High-Resolution Stroke Blood Clot Image Classification Using 3D-CNN and Tile Feature Maps
- 발행기관 서강대학교 일반대학원
- 지도교수 박운상
- 발행년도 2023
- 학위수여년월 2023. 2
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000069953
- UCI I804:11029-000000069953
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
본 연구에서는 3D-CNN과 타일 피처 맵을 활용한 고해상도 뇌졸중 혈전 사진의 분류 방법을 제안한다. 본 논문에서 사용하는 데이터셋인 뇌졸중 혈전 사진은 평균 해상도가 40,000x40,000으로 고해상도이다. 따라서 고해상도 이미지 분류를 위해 이미지 다운샘플링에 기반한 2D 기반 이미지 분류 기법을 적용하는 방식은 정보 손실이 매우 클 수 있기 때문에 어렵다. 본 연구에서는 뇌졸중 혈전 사진의 분류를 위해 두 가지 방법을 제시한다. 첫 번째 방법은 3D-CNN 네트워크의 인풋을 만드는 방법이다. 뇌졸중 혈전 사진과 관계없는 배경 영역을 제거하고 사진을 512x512사이즈의 타일 피처 맵을 생성하여 3D 볼륨을 생성한다. 3D 볼륨의 차원은 (RGB 채널 수 3, 타일 수, 512, 512)가 된다. 생성된 3D 볼륨은 3D-CNN의 입력이 된다. 두 번째 방법은 뇌졸중 혈전 사진을 분류할 수 있는 3D-CNN 네트워크 개발이다. 2D 기반 이미지 분류 기법들과 다르게 3D-CNN은 3D Convolution과 3D Pooling operation을 통해서 타일 피처 방향에서의 정보 학습이 가능하다. 3D-CNN 개발을 위해 Kinetics-400으로 사전 학습된 X3D 네트워크를 뇌졸중 혈전 사진 분류를 위해 Finetuning 하였다. 실험 결과, 본 연구에서 제안하는 타일 피처 맵을 활용한 3D-CNN 기반 뇌졸중 혈전 분류 네트워크는 2D 기반 네트워크보다 뇌졸중 혈전 분류에 있어서 더욱 효과적임이 확인되었다.
more초록 (요약문)
This study proposes a classification method of high-resolution images of blood clot from ischemic stroke with 3D-CNN and tiled feature maps. Blood clot images of strokes used in this paper consist of high-resolution images with an average resolution of 40,000x40,000. Therefore, applying 2D image classification techniques based on image downsampling cannot provide promising results due to the large information loss. Two methods are presented for classifying blood clot images of strokes. The first method is to create an input of a 3D-CNN network. A 3D volume is generated by removing background areas unrelated to blood clots in stroke and creating a tile feature map of size 512x512. Then the dimension of the 3D volume is (number of RGB channels 3, number of tiles, 512 and 512). The generated 3D volume becomes an input of the 3D-CNN architecture. The second method is developing a 3D-CNN architecture to classify blood clots in stroke. Unlike 2D image classification techniques, 3D-CNN can learn information in the tile features through 3D Convolution and 3D Pooling operation. A pre-trained X3D network with Kinetics-400 is finetuned to classify blood clots in stroke. Experiments confirmed that the 3D-CNN based classification network for blood clots in strokes presented in this study is more effective than the 2D-based image classification techniques.
more