검색 상세

형상 정보와 광반사 특성 추정을 위한 전역 최적화 기법 : Deterministic Global Optimization for Estimating Shape and Surface Reflectance

초록/요약

영상정보로부터 물체의 3차원 형상의 복원과 광반사 특성을 추정하는 컴퓨터 연구는 오랫동안 이루어져왔으며, 많은 문제들의 경우에 대해서 수학적, 물리적 모델이 잘 정리되어있다. 그러나 이 모델로부터 해를 구하는 것은 아웃라이어와 non-convexity로 인하여, 매우 풀기 어려운 문제이다. 전통적으로 이 문제를 풀기 위해, 기울기 기반의 지역 최소화 기법이나 RANSAC을 이용하고 있는데, 이 방법들은 지역 최소값과 아웃라이어에 심하게 영향을 받기 때문에 잘못된 해를 도출하기도 한다. 본 논문에서, 해당 컴퓨터 비젼 문제에 대해서 수학적/물리적 모델이 잘 정의되어 있지만, 정확한 해를 구하기 힘든 문제들을 풀기 위한 전역 최적화 기법을 제안한다. 이 논문은 크게 3부분으로 구성되어 있다. 첫 번째 부분은 광반사 특성을 추정하는 문제이며, 두 번째 부분은 강인한 램버시안 포토메트릭 스테레오의 연구를 제안하였다. 마지막으로 레인지 영상의 강인한 3차원 정합 알고리즘을 제안하였다. 첫 번째 부분에서, multiple-lobe analytical BRDF 모델의 파라메터 추정하기 위해서, 컨벡스 프로그래밍과 분기한정법 기반의 전역 최소화 알고리즘을 제안하였다. 두 번째 부분에서는 그림자나 정반사와 같은 비램버시안 성분이 포함된 픽셀로부터 램버시안 픽셀만을 분리하기 위해, Maximum feasible subsystem 알고리즘 기반의 강인한 램버시안 포토메트릭 스테레오 알고리즘을 제안하였다. 제안 방법은 어떠한 초기값을 요구하지 않는 algebraic pixel-wise 최적화 기법이며, 항상 그 전역 최적해가 보장된다. 마지막으로, 레인지 영상의 강인한3차원 정합 알고리즘을 제안하였다. 형상정보의 정합 시, 잘못된 상관관계로 인하여 정합이 실패하곤 한다. 우리의 방법은 아웃라이어나 잘못 매칭된 데이터가 존재하는 경우, 유클리디안 변환 조건을 만족하는 maximum feasible 데이터 셋을 찾는 것을 목표로 한다. 제안 방법은 분기한정법과 maximum feasible subsystem알고리즘을 기반으로 하고 있으며, 항상 전역 최적해가 보장되는 방법이다. 본 논문에서 다양한 실험을 통해서, 제안 알고리즘들의 효용성과 정확성을 보였다.

more

초록/요약

Estimating the reflectance and reconstructing the three-dimensional structure of a scene from images have been well-understood in recent decades, but the involved optimization problems are known that it is difficult to solve due to highly non-convexity and outliers. Traditionally, these problems are solved by gradient-based local optimization algorithms or RANSAC, but these methods can be severely affected by local minima and outliers. This dissertation develops a global optimization algorithm to solve several well-established problems in computer vision to their global optima. This is composed of three parts. The first part is for estimating a BRDF parameter estimation. The second part is for robust Lambertain photometric stereo and the last part is for robust 3D registration algorithm of range images. In the first part, we present a global minimization framework for estimating the parameters of multiple-lobe analytical BRDF model using the techniques of convex programming and branch and bound method. When an analytical BRDF is used to model a natural or artificial surface, reflections can often be represented accurately with multiple non-Lambertian lobes. A BRDF model with multiple lobes can be highly nonlinear and poses a challenge in data fitting for parameter estimation. We consider the Cook-Torrance model with multiple specular lobes, a parametric model with the Gaussian-like Beckmann distributions for specular reflectances. In the second part, we present a Lambertian photometric stereo algorithm robust to specularities and shadows and it is based on maximum feasible subsystem framework. A Big-M method is developed to obtain the maximum subset of images that satisfies the Lambertian constraint among the whole set of captured photometric stereo images which include non-Lambertian reflections. Our algorithm employs purely algebraic pixel-wise optimization without relying on probabilistic/physical reasoning or initialization, and guarantees the global optimality. In the last part, we present a robust 3D registration algorithm for range images. Using registration to align range data often fails due to incorrectly matched correspondences. Our method is developed to find maximum feasible data-set that satisfies the Euclidean transform constraint among the whole corresponding data-set which contains outliers and mismatched data. Traditional methods such as the iterative closed point algorithms may get trapped in local minima due to outliers and the non-convexity of the corresponding optimization problem. Our approach for solving the mathematical optimization problems guarantees global optimality and this optimization framework is based on combining of the Branch-and-Bound method and the maximum feasible subsystem. Experimental results demonstrate the effectiveness of our method.

more