검색 상세

Comparative Study of GAN Models Based on Loss Functions : Evaluating Performance Metrics in Image Synthesis and Tabular Data Generation

손실 함수에 따른 GAN, CGAN, CWGAN의 비교 연구: 이미지 합성 및 표 형식 데이터 생성의 성능 지표 평가

초록 (요약문)

Generative Adversarial Networks (GANs) demonstrate significant effectiveness in learning complex data distributions and generating realistic synthetic data, thus becoming instrumental across diverse applications. This study offers an in-depth comparison of three GAN models: the vanilla GAN, Conditional Generative Adversarial Network (cGAN), and Conditional Wasserstein Generative Adversarial Network (cWGAN), with particular emphasis on their unique loss functions. Two distinctive datasets, the MNIST dataset for image data and a financial dataset for tabular data representation, serve as the foundation for this comparison. Performance evaluation of each model involves visual inspections, assessments based on generator and discriminator losses, and classification tasks utilizing Convolutional Neural Networks (CNN) and XGBoost. The cGAN emerges superior in handling tabular data generation, while the cWGAN exhibits enhanced performance with the MNIST image dataset. These results contribute valuable insights into the strengths of each GAN variant and provide guidance for their selection depending on the data type and task requirements. However, the research also underscores the necessity for more robust, objective evaluation metrics and emphasizes the significant influence of hyperparameters on GAN performance, thus illuminating potential directions for future investigations.

more

초록 (요약문)

GAN(Generative Adversarial Networks)은 복잡한 데이터 분포를 학습하고 현실적인 합성 데이터를 생성하는 데 상당한 효과를 보임에 따라 다양한 분야에서 뛰어난 활용성을 보인다. 이 연구는 GAN, cGAN 및 cWGAN의 세 가지 GAN 모델을 고유 손실 함수에 중점을 두고 심층 비교한다. 심층 비교를 위해 두가지의 데이터셋이 사용이 되었고 이미지 데이터로는 MNIST 데이터 세트와 표 형식 데이터로는 재무변수로 이루어진 대한민국 중소기업 데이터로 이루어져 있다. 각 모델의 성능 평가에는 시각적 검사, Generator 및 Discriminator 손실을 기반으로 한 평가, CNN(Convolutional Neural Networks) 및 XGBoost를 활용한 분류 작업이 포함된다. cWGAN은 MNIST 이미지 데이터 세트에서 향상된 성능을 보이는 반면, cGAN은 표 형식의 데이터 생성을 처리하는 데 있어 우수한 성능을 보였다. 이러한 결과는 각 GAN 변형의 강점에 대한 귀중한 통찰력을 제공하고 데이터 유형 및 작업 요구 사항에 따라 적절한 GAN 모델선택을 위한 지침을 제공한다. 다만 보다 정밀한 비교를 위해선 더 객관적인 평가 지표와 하이퍼 파라미터의 영향 검토의 필요성을 강조하며 향후 조사를 위한 방향성을 제시한다.

more