검색 상세

조선왕조실록 이미지 데이터 셋 획득과 딥 러닝에 의한 고문서 생성 및 복원

Acquiring Image Data Set of The Annals of the Choson Dynastyand Creating and Restoring Historical Documents Data by Deep Learning

초록/요약

본 논문은 고문서 데이터 부족 문제를 해결하기 위해 딥 러닝 모델을 통해 조선왕조실록에서 고문서 문자 이미지를 확보하고, 스타일 변환을 사용하여 고문서 문자 인식과 복원을 위한 데이터 생성에 관해 기술한다. 고문서 스타일의 문자 이미지 생성은 고문서 인식 성능 향상에 기여할 것으로 기대된다. 문자 인식에 대한 연구는 꾸준히 연구된 분야이지만 주로 현대 인쇄 글자와 손글씨에 국한되어 연구되었다. 하지만 고문서의 경우 학습 데이터의 부족과 현대와는 다른 글자 스타일, 이미지 손상으로 인해 인식과 감지에 어려움이 있다. 이에 본 논문에서는 딥 러닝 모델을 사용해 조선왕조실록에서 문자 이미지 데이터를 확보하고, 스타일 변환을 이용하여 고문서 스타일의 문자 이미지를 생성하여 레이블이 지정된 고문서 스타일의 문자 이미지 데이터를 생성하고, 데이터 사용에 대한 결과를 기술하였다.

more

초록/요약

To solve the problem of data shortage of historical documents, this paper obtains the text image of historical documents in the Annals of the Choson Dynasty through deep learning model, and uses style transformation for recognition of historical documents and the creation of data for restoration. The creation of an historical document character text image is expected to contribute to improving the recognition performance of historical documents. The study of character recognition is a field that has been studied steadily, but has been studied mainly in modern printed letters and hand writing. However, in the case of historical documents, there are difficulties in recognition and detection due to lack of learning data, character styles and damaged images that are different from modern times. In this paper, we used the deep learning model to obtain the character image data from the Annals of the Choson Dynasty, and by using the style transformation, we created the character image data of the historical document style, which was labeled, and described the results of the use of the data at the conclusion.

more