영상에 추가된 문자 검출 및 제거 : Detection and removal of superimposed text in image
- 발행기관 서강대학교 대학원
- 지도교수 박래홍
- 발행년도 2007
- 학위수여년월 200702
- 학위명 석사
- 학과 및 전공 전자공학
- 식별자(기타) 000000103482
- 본문언어 한국어
초록/요약
영상에 추가된 문자는 영상에 대한 정보를 포함하고 있다. 그러나 인위적으로 추가된 문자들은 영상 처리시에 문제가 있으며 때로는 추가된 자막들로 인해 시청자가 불편을 느끼는 경우도 있다. 기존의 문자 검출 시스템은 제거의 관점에서 적용된 예가 적으며 일반적인 영상에 대한 결과도 만족스럽지 못하다. 본 논문에서는 영상에 추가된 문자 (자막)를 자동으로 검출하고 제거한 후 자연스러운 영상을 얻는 시스템을 제안한다. 추가된 문자의 검출 방법은 스트로크의 검출, 적응적인 블록 설정, k-means 방법을 이용한 분류, 문자 영역 규정 및 세부 조정 과정 그리고 이진화의 단계로 나누어진다. 스트로크의 검출을 통해 존재할 수 있는 문자열에 적합한 블록을 지정하고 블록들에 대한 스트로크의 분포 특성으로 k-means 방법을 통해 분류한다. 각 단위 블록들은 문자의 특성과 위치 관계에 따라 각각의 문자 블록으로 지정되고 문자의 제거를 위하여 이진화한다. 문자의 자연스러운 제거에 사용된 방법은 inpainting 방법인데, 선택된 영역을 주변 정보를 이용하여 채우는 방법이다. 실험 결과는 제안한 문자 검출 방법이 뛰어난 성능을 보이며 제거 방법에 적용되었을 때 자연스러운 영상을 얻을 수 있음을 보여준다.
more초록/요약
Texts in an image contain information about the image. However, sometimes artificially superimposed texts give some artifacts, thus texts should be removed for some image processing or computer vision applications. Most of previous works on text detection are applied to text recognition. In this thesis, we propose an algorithm for automatic text detection and removal. Additional superimposed texts (captions) are defined as to be detected. The proposed unsupervised text detection method uses a k-means algorithm and consists of five steps: stroke-like line detection, adaptive selection of a block size, k-means clustering, refinement, and binarization. By stroke-like line detection, variable-size blocks can be generated by selecting the adequate block height, in which the approximate height of a text line is obtained. Variable-size blocks are clustered by probabilities of directional strokes. After localization of text candidate blocks using clustering, the proposed binarization method is performed, in which both color and edge information is utilized. After extraction of texts from an image, a selected binary mask is used for image inpainting, which removes the texts while restoring regions occluded by texts. Experimental results show that the performance of the proposed method is better than that of conventional methods, giving a natural non-text image.
more