검색 상세

동영상에서 관심영역에 자동초점을 위한 적응적인 탐색범위 예측을 이용한 disparity 추정

Disparity Estimation for Auto Convergence Using Adaptive Search Range Prediction in Video

초록/요약

최근에 3차원 (3-D) 효과를 위한 다양한 기기 및 장치들이 발전해 왔다. 3-D 효과를 내기 위해서는 stereo 카메라 geometry를 기반으로 region of interest (ROI)에 대해 두 영상 사이의 similarity measure를 이용하여 disparity가 정확히 추정되어야 한다. 3-D 영상을 볼 때 parallax의 크기가 큰 물체를 보면 convergence point가 그 물체 근처에 위치하지 않기 때문에 두 눈이 쉽게 피로를 느낀다. 물체의 추정된 disparity를 가지고 3-D formatter가 disparity 만큼 우 영상을 수평 방향으로 이동시켜 좌, 우 영상을 overlapping 하여 3-D 영상을 만든다. 제안하는 방법에서는 동영상에서 관심영역에 자동초점을 위한 적응적인 탐색범위 예측을 이용한 disparity 추정을 제안한다. 평행하게 놓인 stereo 카메라로부터 좌, 우 영상을 취득한다. 그리고 나서 ROI에 convergence point를 모든 프레임에 대해 자동적으로 맞추기 위해 이전 프레임들에서 추정된 disparity들을 이용하여 현재 프레임의 disparity를 추정한다. 이전에 추정된 disparity들을 이용해 현재 추정될 disparity를 근사화하고 보상하기 위해 1차 Taylor series와 moving average filter가 사용된다. 제안하는 방법과 기존 방법의 성능 비교를 위해 주관적인 평가 방법을 사용하였고, 실험 결과에서는 제안하는 방법이 기존 방법보다 눈의 피로감 없이 편안함을 주면서도 3차원 효과를 주는 것을 보여준다.

more

초록/요약

Recently, various applications with three-dimensional (3-D) information have been developed using stereo equipments for 3-D effect. For generating 3-D effect, disparity should be accurately estimated using a similarity measure based on stereo camera geometry. People watching 3-D video feel visual-fatigue if magnitude of parallax of region of interest (ROI) is too large because a convergence point is not accurately put on the ROI. For feeling 3-D effect, a 3-D formatter overlaps left and right images by only shifting horizontally the right image as much as the estimated disparity of ROI. In this thesis, we propose a disparity estimation algorithm for auto convergence using adaptive search range prediction in stereoscopic video. First, each pair of left and right images is given in parallel stereo camera configuration. Then, for automatically adjusting a convergence point to the ROI, disparity should be accurately estimated using temporal information. A first-order Taylor series approximation and a moving average filter are used to accurately estimate disparity by using previously estimated disparities. We perform subjective evaluation of the proposed algorithm and existing algorithm. Experimental results using several test videos show that the proposed algorithm gives comfortable 3-D effect without causing visual fatigue.

more