Está en la página 1de 22

GEOMETRIA DE IMGENES

La geometra de imgenes facilita el proceso de seleccin de


cmaras para una aplicacin dada, ayuda en el anlisis de escenas
3D y es fundamental en el proceso de creacin de grficos por
computadora y realidad virtual.
OPERACIONES BASICAS
TRASLACIN: supongamos un punto P=(X, Y, Z) y lo deseamos
trasladar a una nueva posicin P* = (X*, Y*, Z*).
X* = X + X0; Y* = Y + Y0; Z* = Z + Z0

X* 1 0 0 X0 X
Y* = 0 1 0 Y0 Y
Z* 0 0 1 Z0 Z
1
Visin Artificial Dr. Renato Salinas 1
La concatenacin de operaciones se simplifica si usamos
matrices cuadradas. Esta representacin se llama Homognea.

X* 1 0 0 X0 X
Y* 0 1 0 Y0
= Y
Z* 0 0 1 Z0 Z
1 0001 1

En general, se tiene v* = Av
En particular, la matriz cuadrada usada para traslacin se
denota por T

Visin Artificial Dr. Renato Salinas 2


ESCALAMIENTO
El cambio de escala de un objeto se puede representar por la
matriz S, con factores de escala Sx, Sy, Sz para cada eje.

Sx 0 0 1
0 Sy 0 1
S=
0 0 Sz 1
0 0 0 1

Visin Artificial Dr. Renato Salinas 3


ROTACIN
La forma ms simple consiste en rotar un punto en torno a uno
de los ejes coordenados.
La rotacin de un punto con respecto a otro punto arbitrario
requiere tres transformaciones: traslacin del punto al origen,
rotacin y traslacin a la posicin original.
La rotacin de un punto P alrededor del eje Z en un ngulo
se obtiene usando la transformacin:

cos sin 0 0 El ngulo de rotacin se


mide en el sentido de las
R = -sen cos 0 0 punteros del reloj cuando se
0 0 1 0 mira al origen desde una
ubicacin sobre el eje Z+.
0 0 0 1

Visin Artificial Dr. Renato Salinas 4


Z

Visin Artificial Dr. Renato Salinas 5


Concatenacin y Transformaciones Inversas
La aplicacin de varias transformaciones puede representarse
por una matriz nica de 4x4.
Por ejemplo, traslacin y rotacin (con respecto a Z) de un
punto v est dada por
v* = R (Tv) = Av
Estas operaciones no son conmutativas por lo general.
Si tenemos un objeto con m puntos, podemos formar una matriz
V= [v1, v2, , vm]
V* = AV

De este modo, los m puntos pueden transformarse con una


operacin matricial.

Visin Artificial Dr. Renato Salinas 6


1 0 0 -X0 cos - sin - 0 0

T-1 =
0 1 0 -Y0 R -1 = -sen - cos - 0 0
0 0 1 -Z0 0 0 1 0
0 0 0 1 0 0 0 1

1/Sx 0 0 1
0 1/Sy 0 1
S =
-1
0 0 1/Sz 1 Para Sk 0
0 0 0 1

Visin Artificial Dr. Renato Salinas 7


Ejemplo 2D:
Y Cul ser el resultado si se rota el
objeto CW en 90 grados y se
80 traslada en X0 = -40, Y0 = 0?

Qu ocurrir si trasladamos
X
20 60
primero y luego rotamos?

Visin Artificial Dr. Renato Salinas 8


Transformaciones de Perspectiva
Las transformaciones de perspectiva proporcionan una aproximacin
a la manera en cual se forma una imagen al mirar al mundo
tridimensional.
Una transformacin de perspectiva Proyecta puntos 3D sobre un
plano (el plano de la imagen, o plano de sensores).

mapeo
3D
2D

Estas transformaciones son no-lineales.

Visin Artificial Dr. Renato Salinas 9


y, Y

x, X
Plano (X,Y,Z) Punto del mundo
Imagen

z,Z

(x,y) Centro del lente

Modelo bsico del proceso de formacin de la imagen. El


sistema de coordenadas de la cmara est alineado con el
sistemas de coordenadas del mundo.
Visin Artificial Dr. Renato Salinas 10
Modelo Bsico
En este modelo, el sistema de coordenadas de la cmara est
alineado con el sistema de coordenadas del mundo.
Para un punto del mundo P, con coordenada Z > i.e., un
punto observable por el sistema, se tiene:

x/f = -X/(Z-f) = X/(f-Z)


y/f = -Y/(Z-f) = Y/(f-Z)
De donde, las coordenadas del punto en el plano imagen
x= fX/(f-Z)
y = fY/(f-Z)
(Hemos usado el smbolo f para denotar la distancia focal)
Las transformaciones son no lineales porque implican la divisin
por la variable Z.
Visin Artificial Dr. Renato Salinas 11
Es conveniente expresar estas ecuaciones de proyeccin no
lineales en forma matricial. Esto puede lograrse empleando
coordenadas HOMOGENEAS.
Las coordenadas Homogneas de un punto con coordenadas
Cartesianas (X,Y,Z) se definen como (kX, kY,kZ,k), con k una
constante arbitraria distinta de cero.
La conversin de coordenadas homogneas de vuelta a
coordenadas Cartesianas se logra DIVIDIENDO las tres primeras
coordenadas homogneas por la cuarta.

Visin Artificial Dr. Renato Salinas 12


Representacin de un punto (vector) en COORDENADAS
CARTESIANAS DEL MUNDO.
X
w= Y
Z kX

wh = kY
TRANSFORMACION HOMOGENEA
kZ
k
La TRANSFORMACION DE PERSPECTIVA se define como
1 0 0 0
0 1 0 0
P=
0 0 1 0
0 0 --1 1
Visin Artificial Dr. Renato Salinas 13
El producto Pwh da un vector que se representa por ch
kX

c h= kY
kZ
-kZ/ +k
Los elementos de ch son las coordenadas de un punto en la cmara,
en forma homognea. Las coordenadas cartesianas se obtienen
dividiendo cada componente de ch por el cuarto.
x X / (-Z)

c= y = Y / (-Z)
z Z / (-Z)

El tercer componente (z) se debe ignorar (al menos para la


transformacin directa).
Visin Artificial Dr. Renato Salinas 14
La transformacin de Perspectiva INVERSA convierte un punto de
la imagen al espacio tridimensional.
1 0 0 0
0 1 0 0
wh = P-1 ch P-1 =
0 0 1 0
0 0 1/ 1

Supongamos un punto en la imagen con coordenadas (x0,y0,0). En


coordenadas homogneas corresponde a ch = k x0, k y0, 0, k.
La aplicacin de la proyeccin inversa da un vector en coordena-
das cartesianas (despus de un paso adicional):

X x0 Este resultado es inesperado,


porque da Z=0 para cualquier
w= Y = y0
punto 3D. Alguna explicacin?
Z 0
Visin Artificial Dr. Renato Salinas 15
El problema est causado porque la proyeccin de una escena
3D sobre el plano imagen no es una transformacin uno-a-uno,
sino muchos-a-uno, por lo que la transformacin inversa no est
definida unvocamente.
El punto imagen (x0,y0) corresponde al conjunto (infinito) de
puntos 3D colineales que estn sobre la recta que pasa por los
puntos (x0,y0,0) y (0,0, ).
Las ecuaciones de esta recta en el sistema de coordenadas
globales son:
X = x0( -Z)/
Y = y0( -Z)/
Estas ecuaciones nos indican que a menos que conozcamos algo
ms del punto 3D que gener el punto de la imagen (e.g. su
coordenada Z), no es posible recuperar completamente el punto
3D a partir de la imagen.

Visin Artificial Dr. Renato Salinas 16


Modelo con dos sistemas coordenados
El problema sigue siendo
determinar la proyeccin de
un punto 3D sobre el plano
imagen.
Si logramos alinear los
dos sistemas coordenados,
podremos aplicar el modelo
de ejes coincidentes para
determinar la proyeccin.

Visin Artificial Dr. Renato Salinas 17


La cmara est montada sobre un pivote (gimbal) desplazado
w0 del origen global. Este pivote puede girar en el plano
horizontal (Pan, ) e inclinarse (Tilt, ). La separacin del
centro del plano imagen con respecto del centro del pivote se
representa por el vector r.
Supngase que inicialmente la cmara est en posicin
normal. La configuracin mostrada previamente puede lograrse
de varias formas. Supongamos que se sigue la siguiente
secuencia de pasos:
1. Desplazamiento del pivote desde el origen global,
2. Giro del eje x (paneo),
3. Inclinacin del eje z (tilt), y
4. Desplazamiento del plano imagen con respecto al
centro del pivote.

Visin Artificial Dr. Renato Salinas 18


Sean G, R, R y C las matrices que denotan las transformaciones
de traslacin del origen global del centro del pivote (gimbal), rotacin
Pan, rotacin Tilt y traslacin del origen del plano imagen con
respecto del centro del pivote, respectivamente.
Un punto del mundo en coordenadas homognea visto por la
cmara tiene la siguiente representacin homognea en el sistema
de coordenadas de la cmara:
ch = P(CRGwh)
Esta ecuacin representa una transformacin de perspectiva que
implica dos sistemas de coordenadas. (R representa la
concatenacin de las dos matrices de rotacin)
x = {(X-X0)cos + (Y-Y0)sen - r1} / {-(X-X0)sen sen +(Y-Y0)cos sen -(Z-
Z0)cos +r3+ }
y = {-(X-X0)sen cos + (Y-Y0)cos cos + (Z-Z0)sen - r3} / {-(X-X0)sen sen
+(Y-Y0)cos sen -(Z-Z0)cos +r3+ }

Visin Artificial Dr. Renato Salinas 19


Ejemplo:
Supongamos que se desea determinar
las coordenadas del vrtice del cubo en la
cmara con plano imagen de 25x25mm

(X,Y,Z) = (1,1,0.2)
X0 = Y0 = 0, Z0 = 1mt
= = 135
r1 = 0.03mt, r2=r3= 0.02mt

= 35mm = 0.035mt

Reemplazando los valores de los parmetros en las ecuaciones de proyeccin, obtenemos:

x = (-0.03)/ (-1.53 + ); y = (-0.42)/ (-1.53 + )


Para = 0.035 se tiene x = 0.7mm, y = 9mm.
Qu ocurrir si disminuyo o aumento la distancia focal?
Que ocurrir si cambio el tamao del sensor?
Visin Artificial Dr. Renato Salinas 20
IMAGEN ESTEREOSCOPICA

Visin Artificial Dr. Renato Salinas 21


X
Imagen 1
(x1,y1)

Z
Origen global

B
Imagen 2

(x2,y2)
Plano de Z constante

X1=x1( - Z1)/ X2=x2( - Z2)/ ,


pero Z1 = Z2 = Z, y X2= X1+B
Entonces, X1=x1( - Z)/ y X1+B=x2( - Z)/ , de donde
Z = - B/(x2 - x1) Z es una funcin de la DISPARIDAD.
Suposicin: cmaras idnticas y alineadas diferencia slo en proyeccin x.
Visin Artificial Dr. Renato Salinas 22

También podría gustarte