검색 상세

건축물 이미지 분류를 위한 SinGAN 기반 데이터 증강

SinGAN-based Data Augmentation for Architectural Image Classification

초록 (요약문)

최근 딥러닝(Deep Learning) 분야의 발전은 혁신적인 진화를 만들어 내고 있지만, 충분한 학습 데이터가 없다면 인공지능 학습에 어려움이 있다. 학습 데이터의 부족으로 과적합(overfitting)이 발생할 경우 충분한 학습 데이터를 확보하기 위해 많은 시간과 비용이 필요하게 된다. 학습 데이터를 확보하기 어려운 상황에서는 학습 데이터를 생성시키는 방법이 사용되는데 이를 데이터 증강(Data Augmentation)이라 부른다. 본 논문에선 건축물 이미지의 자세한 클래스별 분류를 위해 적은 수의 원본 데이터를 가지고 생성모델을 통해 증강하여 분류 성능이 효과적으로 향상되는지 실험한다. 다중 이미지 분류에서 한 클래스의 데이터를 10개로 가정하고, 부족한 데이터 클래스를 SinGAN(Single Image GAN) 알고리즘을 통해 생성한다. 또한 과적합을 피하기 위해 일종의 노이즈 역할을 하면서 건축물 이미지와 정성적으로 어색하지 않은 사람 이미지를 합성해 학습 데이터 세트를 늘린다. 실험을 통해 6개의 건축물을 class별로 분류하고 학습 데이터세트에 생성이미지 추가에 따른 성능 변화를 확인한다. 원본 데이터 기반 합성이미지와 SinGAN 기반 생성한 이미지를 추가함에 따라 클래스 별로 정확도(accuracy), 정밀도(precision), 재현율(recall), F1-score에서 성능 향상이 이루어 진 것을 확인할 수 있었다.

more

초록 (요약문)

In recent years, the field of Deep Learning has witnessed groundbreaking advancements, driving an innovative evolution. However, the absence of sufficient training data poses a significant challenge to AI learning. When there is a scarcity of training data, it becomes difficult to overcome the issue of overfitting, requiring substantial investments of time and resources to acquire an ample dataset. In such situations, data augmentation techniques are employed to generate synthetic training data, which is known as Data Augmentation. In our research, we investigate how a generative model can be used to augment a limited amount of original data in order to greatly improve the classification accuracy of detailed class-based architectural image classification. Given the challenge of having only 10 data samples per class in multi-image classification, we employ the SinGAN (Single Image GAN) algorithm to generate supplementary data for classes that are underrepresented. Furthermore, to mitigate the risk of overfitting and expand the training dataset, we introduce synthesized human images that act as a form of noise and seamlessly integrate with the architectural images. Through experiments, we classify 6 architectural classes and examine the impact of adding generated images to the training dataset on performance metrics such as accuracy, precision, recall, and F1-score. As we added more original data-based synthetic images and SinGAN-generated images, we were able to observe performance improvements in accuracy, precision, recall, and F1-score for each class.

more