검색 상세

고문서 인식을 위한 문자 변환 및 데이터 생성

Character Transfer and Dataset Generation for Historical Documents Recognition

김병준 (서강대학교 영상대학원)

원문보기

초록 moremore
본 논문은 이미지 변환 모델의 딥러닝 기법을 활용한 문자 이미지 생성 및 변환과 그에 사용되는 데이터 생성에 대해 기술한다. 문자 이미지 생성 및 변환은 고문서 혹은 일상의 영상 내의 문자 인식 성능에 기여할 것으로 기대된다. 문자 인식에 대한 연구는 영상처리 분야에서 꾸준히 연구된 분야지만 주로 일상생활에 밀접한 현대어에 국한되었다. 딥러닝 기술의 다양한 연구를 통해 학습을 통한 문자 인식은 높은 성능을 가지게 되었다. 하지만 현대어가 아닌 고문서의 경우 데이터의 부족과 이미지 손실로 인해 인식의 어려움이 있다. 이에 본 논문에서는 영상 변환 기법인 GAN(Generative Adversarial Network)를 기반으로 하는 Pix2Pix, DiscoGAN, CycleGAN을 이용하여 고문서의 문자 데이터를 현대 폰트로 변환한다. 그리고 데이터가 부족하여 학습에 어려움을 극복하고자 새로운 고문서 데이터를 생성한다.
본 논문은 이미지 변환 모델의 딥러닝 기법을 활용한 문자 이미지 생성 및 변환과 그에 사용되는 데이터 생성에 대해 기술한다. 문자 이미지 생성 및 변환은 고문서 혹은 일상의 영상 내의 문자 인식 성능에 기여할 것으로 기대된다. 문자 인식에 대한 연구는 영상처리 분야에서 꾸준히 연구된 분야지만 주로 일상생활에 밀접한 현대어에 국한되었다. 딥러닝 기술의 다양한 연구를 통해 학습을 통한 문자 인식은 높은 성능을 가지게 되었다. 하지만 현대어가 아닌 고문서의 경우 데이터의 부족과 이미지 손실로 인해 인식의 어려움이 있다. 이에 본 논문에서는 영상 변환 기법인 GAN(Generative Adversarial Network)를 기반으로 하는 Pix2Pix, DiscoGAN, CycleGAN을 이용하여 고문서의 문자 데이터를 현대 폰트로 변환한다. 그리고 데이터가 부족하여 학습에 어려움을 극복하고자 새로운 고문서 데이터를 생성한다.