Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2.4.1. Introducción
Los métodos de calibración de una cámara determinan los parámetros del modelo, haciendo
corresponder alguna característica de la imagen adquirida de un patrón de calibración a la
característica correspondiente de la imagen por el modelo de la cámara. Para eso se elige
medir, preferiblemente, unos valores que relacionen la geometría del mundo 3D con la
geometría de la cámara. Estos valores pueden ser la ubicación de las intersecciones de una
cuadrícula o de una grilla colocada de frente a la cámara en el momento de tomar la foto.
En este caso, la grilla sería el patrón de calibración, no obstante puede elegirse otro, según
la conveniencia que se tenga para adquirir el dato. Por ejemplo, que sea necesario, como
veremos más adelante que ninguna de las coordenadas según el marco de referencia de la
escena sea siempre cero, específicamente aquella que le da profundidad a la foto tomada de
la escena.
En este capítulo nos concentraremos en estudiar los métodos de calibración más conocidos
en la actualidad para discutir de manera teórica sus ventajas y desventajas y para que sirva
de base al siguiente capítulo en que se implementaron algunos métodos observando los
resultados experimentales.
Los métodos lineales tienen la ventaja de que son computacionalmente eficientes pero
sufren de una falta de exactitud y robustez. Los métodos no lineales, en cambio, ofrecen
mayor exactitud y soluciones robustas pero son computacionalmente intensos y requieren
25
El método de Tsai [TSAI 86] utiliza el modelo pinhole de la cámara para hallar parámetros
intrínsecos y parámetros extrínsecos, incluyendo el parámetro de distorsión. Este método
es de referencia obligatoria en los trabajos de calibración de cámaras y ha marcado un
paradigma a seguir con el objetivo de mejorarlo.
La principal desventaja de este método es que utiliza unos datos propios de la fabricación
de la cámara que normalmente no vienen especificados. Los utiliza para hallar
explícitamente la distancia focal f, y el factor de incertidumbre de escala sx.
La transformación que asume el método de Tsai involucra varios pasos [TSAI 86]:
1. Transformación desde el sistema de coordenadas del mundo Pw=(xw , yw, zw) al sistema
de coordenadas de la cámara Pc=(xc,yc,zc)
Pc = R . Pw + t Ec. 2.46
r1 r2 r3 Tx
R = r4 r5 r6 y t = Ty Ec. 2.47
r r8 r9 T
7 z
fx c
Xu = Ec. 2.48
zc
fy c
Yu = Ec. 2.49
zc
3. Para tener en cuenta la distorsión Tsai asume que las coordenadas reales de la imagen
son las distorsionadas (Xd , Yd):
Xd + Dx = Xu Ec.2.50
Yd + Dy = Yu Ec.2.51
En este caso:
4. En este punto, se hacen necesarios los parámetros dados por el propio fabricante. La
transformación de coordenadas reales (Xd , Yd) a coordenadas de la imagen (X,Y) es:
s X
X x d c x Ec. 2.55
d ''x
Y
Y d cy Ec. 2.56
d'
y
Para este caso (X,Y) es la localización del punto en la imagen mostrada en el monitor, s x es
el factor de incertidumbre de escala, entre las coordenadas calculadas de los píxeles y las
coordenadas reales, debido a errores en el proceso de digitalización.
La siguiente ecuación permite hallar d''x a partir de otros parámetros dados previamente a la
calibración
Nc x
d''x = d ' x Ec. 2.57
Nf y
d'x es la distancia centro a centro entre los elementos sensores CCD adyacentes en la
dirección X.
d'y es la distancia centro a centro entre los elementos sensores CCD adyacentes en la
dirección Y.
27
Estos últimos cuatro parámetros son básicos para realizar la calibración según el método de
Tsai [TSAI 86] y constituyen la principal dificultad de aplicación porque el usuario no
siempre va a contar con el conocimiento previo de ellos. Precisamente realiza una
calibración para conocer las características de la cámara, en general lo busca es un método
que se las dé sin tener que consultar las medidas del fabricante. La mayoría de los métodos
lo que hace es calcular implícitamente estas medidas enmascarando por ejemplo la
distancia focal. Sin embargo, el método de Tsai [TSAI 86] es paradigmático para todos los
demás por su antigüedad y precisión.
Es conveniente recordarle al lector que los diferentes autores de métodos para calibración
de cámara utilizan distintas notaciones para representar las mismas variables. En este caso
se seguirá la notación inicial de la sección 2.1 [HORAUD 95] para explicar el método de
Hall [HALL 82].
Para evaluar los coeficientes de la matriz M en las ecuaciones 2.58 y 2.59, es suficiente
escribir el sistema de ecuaciones para los puntos de la imagen. Cada punto (Xi,Yi,Zi) se
proyecta en (ui,vi) formando dos ecuaciones. Estas ecuaciones son lineales y basta tener
seis puntos de la escena con sus respectivas proyecciones en la imagen para determinar los
28
12 coeficientes de la matriz M. Las ecuaciones (2.58) y (2.59) pueden escribirse como una
combinación de mij :
m11
m12
m
13
m14
m 21
Xi Yi Zi 1 0 0 0 0 ui X i u i Yi ui Z i u i m 34
0 m 22 Ec. 2.63
0 0 0 Xi Yi Zi 1 v i Xi v i Yi v i Z i vm
m 23 i 34
m 24
m31
m
32
m33
En el caso especial del método de Ayache [AYACHE 99] se asume la restricción de que Tz
= m34 puede considerarse con valor 1 de forma que se tienen 11 incógnitas. en realidad lo
que se hace es que se toma el sistema de ecuaciones (2.61) y con el fin de obtener una
solución no trivial, se escoge m34 = 1, por lo que se están dividiendo todos los coeficientes
de la matriz entre m34 y se determinan los parámetros de la cámara en un factor cercano.
Este método tiene la particularidad de que es el método base de la mayoría de los métodos
de calibración en la actualidad superando en eso al método de Tsai [TSAI 86], porque no
necesita unos parámetros anteriores a la calibración y porque es realmente sencillo y de
buena efectividad. Se continúa con el tipo de calibración implícita ya estudiada.
Este criterio es importante porque es el usa Toscani [TOSCANI 87] para resolver este
sistema de ecuaciones, aplicando una búsqueda restringida con un vínculo que mantenga
invariante la solución bajo un sistema de coordenadas del mundo. La ecuación (2.61) se
puede separar en dos sumas a partir de las ecuaciones (2.63) y (2.64) y escribir así:
donde
Xi Yi Zi 1 0 0 0 0 ui
B2n x 9 = Ec. 2.68
0 0 0 0 Xi Yi Zi 1 vi
y
30
ui X i u i Yi ui Z i
C2n x 3 = Ec. 2.69
v X vi Yi ui Z i
i i
con la constante:
B t Bx 9 B t Cx 3 0 Ec. 2.75
C Cx 3 C Bx 9 λ(x 3 ) 0
t t
Ec. 2.76
Despejando se obtiene:
x 9 ( B t B ) 1 B t Cx 3 Ec. 2.77
Xd = Xp + ΔX Ec. 2.81
Yd = Yd + ΔY Ec. 2.82
2 2
2
r = Fx. x' Fy. y' Ec. 2.85
z' z'
x'
Xp = Fx . + Xc Ec. 2.86
z'
y'
Yp = Fy . + Yc Ec. 2.87
z'
Tenemos que:
x' x' 2 2
Xd = Fx . + Xc + Kd . Fx . Fx. x ' Fy. y ' Ec.
z' z' z' z '
2.88
32
y' y' 2 2
Yd = Fy . + Yc + Kd. Fy . Fx. x ' Fy. y ' Ec.
z' z' z' z '
2.89
X Y Z
Xp= , Yp = , distancia focal f = Ec. 2.90
w w w
Con:
1 Xc
0
X lx f
x 1 Yc x
Y
0 f y
Z P y ly Ec. 2.91
z 1 z
w 0 0
0 1
0
f
Las ecuaciones (2.39) y (2.40) se reescriben, teniendo en cuenta que Kd=0 y pasando a
multiplicar la variable z:
En este caso, x',y',z' representan lo mismo que en la ecuación (1.22), es decir, la proyección
de un punto de la escena en el plano imagen con coordenadas referenciadas al plano de la
cámara, por lo que a x',y',z' se les puede llamar coordenadas-cámara. Xd y Yd, siguen
siendo las coordenadas imagen ( (u,v) según [HORAUD 95]).
x
x' a11 a12 a13 X0 0
y
y ' a 21 a 22 a 23 Y0 0 Ec. 2.94
z' a z
31 a 32 a33 Z 0 0
1
Chaumette representa a los parámateros de rotación como aii (i=1,2,3) y a los parámetros de
Translación como X0, Y0, Z0 . Finalmente los punto en la escena en coordenadas del mundo
son
Definidas ya x', y', z' se remplazan en Ec. 2.91 y Ec. 2.92 para obtener las siguientes dos
ecuaciones:
X d x0 X d y0 X d z0 x0 y0 z0 0 0 0 1 0 X d 0
I=
Yd x 0
Y p y0 Yp z0 0 0 0 x0 y0 z0 0 1 Yd 0
Ec. 2.100
Donde I =Ij con j=1 hasta 12. Los elementos de I traen consigo los parámetros de calibración:
Una vez hallados los parámetros del modelo lineal se remplazan para obtener las que hemos
llamado coordenadas cámara (x',y',z').
Estas coordenadas cámara se tienen en cuenta luego para obtener un conjunto de puntos
muy importante. Dicho conjunto de puntos es producto del modelo y se halla remplazando
las coordenadas cámara en las mismas ecuaciones (2.87) y (2.88) pero con un conjunto de
parámetros (que incluye a una Kd) que deberán evaluarse repetidamente hasta obtener el
menor error. Al principio ese conjunto de parámetros será el que se adquirió por medio de
la técnica lineal en que Kd es igual a cero, pero se irán cambiando (y ese cambio incluye a
la Kd inicialmente en cero) hasta lograr una correspondencia aceptable con los datos de la
imagen. Es decir, en esta parte del proceso es preciso aplicar un método iterativo que
realice una búsqueda del mejor conjunto de parámetros a partir de un conjunto inicial.
N
C2 = [( X
i 1
di X mi ) 2 (Ydi Ymi ) 2 ] Ec. 2.108
En este punto se debe elegir con ese criterio de error que método es mejor entre los varios
que hay siendo el más destacado por su efectividad y rapidez el de Levenberg-Maquardt.
[11]
Donde m ( A, Ri , ti , M j ) es la proyección del punto Mj en la imagen i. Es decir para todos
los puntos de calibración de la imagen se prueban diferentes parámetros de tal manera que
se halle el conjunto de ellos que de cómo resultado el menor error entre los puntos
estimados por el modelo y los puntos reales de la imagen.
0 u0
A= 0 v0 Ec. 2.110
0 0 1
con (u 0 , v0 ) como las coordenadas del centro óptico o punto principal y con α y β como
los factores de escalamiento en los ejes u y v de la imagen respectivamente.
X
u Y
s v A
Z
1 [r1 r2 r3 t] 1 Ec. 2.111
El modelo lineal en Zhang está basado en el mismo modelo pin-hole de los métodos
anteriormente explicados. No obstante, para modelar la distorsión radial, Zhang utiliza una
transformación lineal.
2 2 2 2 2
u = u + (u-u0). [k1(x + y ) + k2(x + y ) ] Ec. 2.112
2 2 2 2 2
v = v + (v - v0). [k1(x + y ) + k2(x + y ) ] Ec. 2.113
En este caso, con los parámetros obtenidos de las dos etapas anteriores (la lineal y la no
lineal) se estiman unas coordenadas imagen (u,v) que se suponen ideales, es decir sin
distorsión y a ellas se les suma la distorsión dada por dos constantes k, para obtener las
coordenadas imagen reales (uˆ , vˆ) .
Este modelo puede ser descrito de manera matricial si tenemos en cuenta todos los puntos
de calibración, así:
(u u 0 )( x 2 y 2 ) (u u 0 )( x 2 y 2 ) 2 k1 uˆ u
2 2
Ec. 2.114
(v v0 )( x y ) (v v0 )( x y ) k 2 vˆ v
2 2 2
Con D como una matriz de 2m filas por 2 columnas y d como un vector vertical de 2m
filas. La solución a este sistema se produce mediante la aplicación de la matriz
pseudoinversa:
Una vez estimados los parámetros de distorsión k1 y k2, se entra a la cuarta etapa en donde
se hace una optimización de todo el conjunto de parámetros, tomando como estimaciones
iniciales las encontradas en las tres etapas anteriores. El criterio de minimización sería el
siguiente:
37
n m 2
i 1 j 1
m ij m
ˆ ( A, k1 , k 2 , Ri , t i , M j ) Ec.
2.117
2.4.8. Conclusión
BIBLIOGRAFIA
[AZAR 99] Azar A., Musé P. “Calibración monocular de cámaras”. Instituto de Ingeniería
Eléctrica, Facultad de Ingeniería. Universidad de la República. Uruguay. 1999
[GONZALEZ 93]C. González, P.E. Woods, “Digital Image Processing” Third Edition.
Addison-Wesley, 1993
[HORN 86]Horn, Paul. “Robot Vision”. The MIT Press- McGraw-Hill Book Company.
1986
[30] Q. Ji, Y. Zhang. Camera Calibration with Genetic Algorithms. IEEE Transactions On
Systems, Man, And Cybernetics—Part A: Systems And Humans, Vol. 31, No. 2, March
2001
[10][AYACHE 99] N. Ayache “Artificial Vision for Mobile Robots”. MIT Press,
Cambridge, MA, 1999
[TSAI 86] RY.Tsai, "An efficient and accurate camera calibration technique for 3d machine
vision, " Conference on Computer Vision and Pattern Recognition, pp. 364-374, Miami
Beach, USA, June 1986.