Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERIA
Reconocimiento Facial
Mediante Imgenes Estereoscpicas
Para Control de Ingreso
Tesis de Grado de Ingeniera en Informtica
Autor:
Padrn:
78630
Tutor:
Cotutor:
Tabla de Contenidos
1 Introduccin ... 4
1.1 Motivacin ... 5
1.2 Estructura de la tesis 6
2 Estado del arte ... 8
2.1 Comienzos de la estereoscopa 9
2.2 Historia del reconocimiento facial ... 10
2.2.1 Clasificacin de los mtodos de reconocimiento facial . 12
2.3 Reconocimiento 3D .. 13
2.3.1 Tcnicas de obtencin de modelos 3D 15
2.3.2 Mtodos de reconocimiento facial 3D . 16
2.3.3 Aplicaciones comerciales desarrolladas ...... 19
2.3.4 Casos de implementaciones de sistemas .. 19
de reconocimiento facial
3 Captura y armado del modelo 3D .. 24
3.1 Captacin de imgenes estereoscpicas Modelo pinhole ..... 24
3.1.1 Descripcin de la toma de las fotografas 25
3.2 Modelo 3D del sistema facial ... 27
3.2.1 Puesta en correspondencia de puntos homlogos 28
3.2.2 Triangulacin de Delaunay 30
4 Soluciones propuestas para el reconocimiento facial . 34
4.1 Distancias geodsicas 34
4.2 Curvaturas de superficies .. 39
5 Algoritmos de comparacin de modelos faciales 44
5.1 LDA: Anlisis Discriminante Lineal . 44
5.2 Error cuadrtico medio 48
6 Verificacin experimental .. 50
7 Conclusiones, limitaciones y futuras lneas de investigacin 56
8 Glosario .. 60
9 Anexos . 62
9.1 Calibracin de una cmara digital : mtodo simplificado 62
9.2 Configuracin normal de dos cmaras: Clculo de las coordenadas del
punto objeto ..... 65
9.3 Configuracin general de dos cmaras: Clculo de las coordenadas del
punto objeto. Caso general. 67
9.4 Propiedades de la triangulacin de Delaunay 70
9.5 Desarrollo de la obtencin de las curvaturas de superficie . 72
10 Referencias y bibliografa ..... 76
1 Introduccin
Los seres humanos se reconocen entre s por medio de los rostros, se puede decir que
se almacenan en la memoria las imgenes de las caras de gente que se conoce. Para
ello, se tienen en cuenta los rasgos caractersticos que permiten identificarlas.
Generalmente se logra el reconocimiento an con cambios importantes producto del
paso del tiempo, el uso de accesorios y maquillaje entre otros. Esta capacidad es
excelente para reconocer caras de conocidos, aunque no es tan buena cuando se trata
de caras poco familiares.
El progreso computacional de las ltimas dcadas, permiti automatizar el
reconocimiento facial modelizando los mecanismos de la percepcin visual de los
seres humanos con el objeto de poder emplearlo en diversos campos de aplicacin,
principalmente, en los casos que se requiere mejorar la seguridad a todo nivel.
En la actualidad los mtodos biomtricos para el reconocimiento de las personas
resultan de sumo inters, debido a que los mtodos convencionales, como solicitar
algn documento de identidad, el uso de una tarjeta electrnica o contrasea personal,
no son ni suficientemente seguros, ni prcticos.
El reconocimiento facial biomtrico es un mtodo interesante dada su caracterstica de
no invasivo, por lo cual puede ser usado incluso sin el conocimiento y colaboracin
del sujeto. Adems, un reciente estudio sobre el reconocimiento facial humano versus
el computacional, realizado por [Phillips et al, 2007] demostr que sobre una misma
muestra de personas, los sistemas de reconocimiento facial, desarrollados en la ltima
dcada, se han perfeccionado al punto de ser capaces de alcanzar los mismos niveles
que los mecanismos del ser humano y son mejores a la hora de detectar falsos
positivos, es decir, casos donde una cara se da por reconocida contra otra que no es la
correspondiente. Esto se debe a que en la respuesta perceptiva intervienen factores
subjetivos. Sin embargo, los sistemas automticos no son de todos modos
suficientemente confiables debido a diversos factores que afectan su eficiencia como
por ejemplo, la iluminacin de las imgenes, deformaciones gestuales, cambios
fisonmicos (barba bigote cirugas), uso de accesorios o adornos (anteojos aros),
el punto de vista, oclusiones, escala de la imagen, entre otros. Por esta razn, la
mayora de los sistemas actuales exigen ciertas restricciones para funcionar
correctamente. Pese a ello, diversos estudios realizados demuestran que an sirven
como apoyo de la seguridad.
Actualmente se busca mejorar la calidad del reconocimiento facial a travs del uso de
datos tridimensionales (3D), dado que los mismos son menos sensibles que los
bidimensionales, a los cambios de luz, variaciones de postura en la imagen,
maquillaje y expresiones faciales (a condicin que se tomen ciertos puntos de la cara).
Los modelos tridimensionales faciales proveen informacin sobre caractersticas de la
superficie de la cara, que varios de los nuevos algoritmos estn utilizando para
optimizar el reconocimiento facial.
1.1 Motivacin
El reconocimiento facial es un mtodo biomtrico que tiene un vasto campo de
aplicacin en el mundo tecnolgico de la actualidad, en especial, en lo que respecta a
la seguridad.
Por ejemplo, podra ser utilizado en menor escala en sistemas de acceso para las
empresas, reconocimiento de amigos en las redes sociales, bsqueda de caras por
similitud, identificacin en un celular o computadora, acceso a cajeros automticos. Y
a gran escala, podra ser instrumentado por las autoridades para la localizacin de
personas buscadas, control de pasaportes, seguridad en calles, en estadios de ftbol,
en recitales o en aeropuertos.
Los mecanismos automticos de reconocimientos de caras ms conocidos en la
actualidad consisten en comparar imgenes monoculares de las mismas. Esto puede
ser insuficiente dado que el ngulo de toma y los cambios faciales por motivos como,
por ejemplo, la iluminacin, postura, expresin facial, uso de maquillaje y uso de
accesorios dificultan la identificacin.
En el desarrollo de este trabajo, con el objetivo de generar un mtodo de
reconocimiento facial con un alto nivel de efectividad se utilizarn MNSF buscando
mejorar la respuesta ante los posibles problemas de cambios, particularmente pero no
exclusivamente, debido al ngulo de toma. De todas maneras, seguirn presentndose
limitaciones a la hora de realizar los reconocimientos dado que se trabaja con caras
tomadas en condiciones normales o neutrales, es decir sin expresiones particulares, y
sin oclusiones. Queda, entonces la posibilidad de realizar extensiones de este trabajo
con diferentes orientaciones.
Se utilizaron dos criterios para la obtencin de propiedades intrnsecas que
permitieron comparar los MNSF. Estas caractersticas invariantes del MNSF no
dependen del sistema al que estn referidos los puntos que conforman el modelo, por
Aplicaciones Especificas
videos juegos, realidad virtual,
programas de entrenamiento,
interaccin robot-humano
Tarjetas Inteligentes
Licencias de conducir,
programas de ayuda social
pasaporte, documento de
identidad nacional, registracin
de voto, fraudes en asistencia
social
supervisin adulta de TV,
ingreso a sesin en dispositivo
porttil y/o PC
seguridad en aplicaciones,
seguridad en base de datos,
encriptacin de archivos,
seguridad intranet, acceso a
internet, registros mdicos,
seguridad en terminales
comerciales
control CCVT, vigilancia
avanzada por video ,
robo en tiendas, seguimiento e
investigacin de sospechoso
Seguridad de la Informacin
Tabla 2.1 Aplicaciones tpicas de reconocimiento facial segn [Zhao et al, 2003]
10
En 1987 Kirby & Sirobich aplicaron una tcnica del lgebra lineal llamada anlisis de
componentes principales (PCA, Principal Component Analysis), al problema del
reconocimiento facial. Con lo que demuestran que cualquier cara puede ser
representada por la mezcla de un conjunto de caras que conforman una base llamadas
eigenpictures, con un error de hasta 3%. Lo cual fue considerado hito en la
materia al mostrar que eran requeridos menos de 100 valores para cifrar
acertadamente la imagen de una cara convenientemente alineada y normalizada.
En 1991 [Turk & Pentland, 1991] basndose en las investigaciones de Kirby &
Sirobich, utilizan el PCA, en una tcnica que fue conocida como eigenfaces, y se
convirti en un estndar de comparacin de la performance de los nuevos algoritmos
para el reconocimiento de rostros.
El mtodo se basa en tomar un conjunto de caras de entrenamiento con las cuales se
define una cara promedio, los vectores de distancia de las caras a la cara promedio
son sujetos a PCA para obtener los autovalores y autovectores ortonormales que
mejor describen la distribucin de datos. Son estos autovectores los llamados
eigenface, que se utilizan luego para mediante una combinacin lineal definir una
cara.
Al querer reconocer una nueva imagen de una cara, esta se proyecta en el espacio de
caras y se obtienen su combinacin lineal. Para determinar a que clase pertenece se
minimiza la distancia eucldea con cada clase, y si esta debajo de cierto umbral se la
clasifica perteneciente a dicha clase y sino no se la reconoce. Adems el algoritmo
puede detectar si no se identifico porque no es una cara o porque la cara es nueva, con
lo cual da la opcin de agregarla a la base.
De todos los algoritmos utilizados en el campo del reconocimiento facial 2D, existen
tres algoritmos que son los ms estudiados y aplicados por sus ptimos resultados
como se seala en [Zhao et al, 2003]: Anlisis de componentes principales (PCA Principal Componen Analysis), el Anlisis Lineal Discriminante (LDA Linear
Discrimant Analysis) y Correspondencia entre Agrupaciones de Grafos Elsticos
(EBGM - Elastic Bunch Graph Matching).
El mtodo de anlisis de componentes principales (PCA), es el ms conocido y como
se menciono anteriormente se ha tomado como parmetro de comparacin para los
nuevos algoritmos. Y el trabajo ms reconocido utilizando esta tcnica es el realizado
por [Turk & Pentland, 1991] con sus reconocimiento facial mediante Eigenfaces.
De acuerdo con [H. Zhao et al, 2008] varios mtodos de reduccin de dimensiones
han sido aplicados en el campo de reconocimiento facial con xito. Fisher Linear
Discriminant Analisys ( FLDA) , una versin de LDA, es uno de los ms populares,
pero hay varias otros mtodos basados tambin en LDA que se han aplicado con
buenos resultados, y que buscaron superar las falencias de FLDA como ser el
problema de singularidad conocido como Small Simple Size ( SSS ), dado cuando hay
una sola imagen por cada individuo.
Bsicamente LDA, como se indica en [Duane Blackburn et al, 2006], es una tcnica
de clasificacin de datos que mediante una aproximacin estadstica busca clasificar
muestras de clases desconocidas basadas en ejemplos de entrenamiento con clases
conocidas. Esta tcnica busca maximizar la varianza entre las clases (between-class),
es decir entre las caras de cada persona distinta, as como tambin minimizar la
varianza de cada clase (within-class), es decir entre caras de un mismo individuo.
11
En el estudio realizado por [Belhumeur et al, 1997] se utilizo FLDA para implementar
el reconocimiento de rostros con FisherFaces, y se lo comparo con el mtodo
Eigenfaces, obteniendo como resultado que el mtodo FisherFaces es mejor a la hora
de lidiar simultneamente con la variacin de luz (incluye intensidad, direccin y
nmero de fuentes de luz) y expresiones faciales.
Como se detalla en [Sigari et al, 2007] en el mtodo EBGM, se definen varios puntos
especficos de la cara (como ser esquinas de los ojos, punta de la nariz, etc) que van a
ser los mismos aun cuando vari la postura. Y mediante la aplicacin de un filtro de
transformacin Gabor, se procesa la imagen y se crea una arquitectura que proyecta el
rostro sobre una grilla elstica. Cada nodo de la grilla es conocido como jet gabor,
que describe el comportamiento de la imagen alrededor de un pxel. El modelo
obtenido para cada imagen de la cara con los jet gabor se denomina image graph.
Se genera con algunos de los modelos que conforman la galera de entrenamiento, que
tienen la misma postura, un grfico genrico con la combinacin de varias caras
llamado face bunch graph(FBG), el cual se utiliza para generar el image graph de
nuevas caras, ayudando de esta manera a ubicar los puntos especficos. Al inicio esto
se realiza en forma manual, pero a medida que se enriquece el modelo con caras de
entrenamiento se hace en forma automtica este reconocimiento de puntos en las
imgenes de las nuevas caras.
Para realizar el reconocimiento se compara el image graph de la nueva cara a
reconocer, contra todos los modelos de la galera de entrenamiento basndose en una
funcin de similitud. Esta funcin de similitud puede formularse de distintas formas,
siempre teniendo presente que es la responsable de que se realice un buen
reconocimiento.
Por ejemplo en [Wiskott et al, 1999] se ha tomado esta funcin de similitud como un
promedio de la similitud entre pares de jets correspondientes.
12
Trabajos
Principal Component Anlisis (PCA)
Eigenface
Probabilistic eigenface
Fisherfaces / subspace LDA
SVM
Evolution pursuit
Features lines
ICA
Otros
LDA / FLD
PDBNN
Basados en Caractersticas
Pure geometry methods
Dynamic link architecture
Hidden Markov model
Convolution Neural Network
Hbridos
Modular eigenface
Hybrid LFA
Shape-normalized
Component-based
Tabla 2.2.1.1 - Categorizacin de Mtodos sobre Imgenes Estticas segn [Zhao et al, 2003]
2.3 Reconocimiento 3D
Existi un test de evaluacin para los algoritmos comerciales y prototipos de tcnicas
de reconocimiento facial, llamado Face Recognition Vendor Test (FRVT) realizado
por The Nacional Institute of Standarts and Technology (NIST), cuyas evaluaciones
fueron realizadas en el 2000, 2002 y 2006 por ltima vez. Mediante el anlisis de
estas pruebas realizadas se pudo obtener informacin para determinar como las
tcnicas de reconocimiento facial pueden ser mejoradas y recomendar futuras
direcciones de investigacin.
Como resultado de la ltima evaluacin realizada en el 2006, como seala [Phillips et
al, 2007], se obtuvo que desde 1993 al 2006 se ha mejorado en dos rdenes de
magnitud el porcentaje de error (ver figura 2.3.1). Para realizar la comparacin se
utiliza el estudio realizado con eigenfaces de [Turk & Pentland, 1991]. Tambin se
han tenido en cuenta para medir el avance de los algoritmos, los resultados de las
evaluaciones del test Face Recognition Technology (FERET), que fuera realizado
previamente en 1994, 1995 y 1996.
13
Figura 2.3.1 - La reduccin en el promedio de error para los algoritmos de reconocimiento de rostros
en base a las evaluaciones de FERET, FRVT 2002 y FRVT 2006.
Figura obtenida de [Phillips et al, 2007]
En base al anlisis, tambin se concluyo, como indica [Bowyer et al, 2005], que el
actual estado del arte del reconocimiento facial 2D es insuficiente para la alta
demanda biomtrica de las aplicaciones, a partir de lo cual intentar usar informacin
3D se ha vuelto la direccin de bsqueda emergente con la esperanza de hacer que el
reconocimiento facial sea ms exacto y robusto.
Por esta razn, a pesar de que histricamente es muy poco el trabajo realizado en esta
rea, en los ltimos aos han aumentado ampliamente las investigaciones usando
informacin 3D.
Actualmente, la mayora de los estudios de reconocimiento facial 3D se han orientado
hacia el uso de tcnicas holsticas o de tcnicas de apareo de superficies 3D. [Gupta et
al, 2007]. Entre los mtodos holsticos se encuentran por ejemplo PCA, LDA, que
representan un avance de las tcnicas que fueron bastante exitosas con imgenes 2D.
Incluso el algoritmo 3D PCA es, tambin, considerado como un referente de
evaluacin de la performance de otros algoritmos de reconocimiento facial 3D.
14
15
3D Multimodal
Son las tcnicas que utilizan la informacin conjunta de imgenes tridimensionales y
bidimensionales. Como se seala, en el estudio realizado por [Bowyer et al, 2005]
sobre mtodos 3D multimodales, no fue hasta el ao 2000 que se empezaron a evaluar
algoritmos que combinan resultados de datos en 2D y 3D. La forma ms comn es
utilizar separadamente los datos 2D y 3D para luego combinar los resultados. En
general, en base a los resultados reportados dicha combinacin tiene una respuesta
mucho mejor que cuando se utilizan las mismas tcnicas 2D y 3D por separado. Ver
tabla 2.3.2.2 para un detalle de las investigaciones sobre los mtodos multimodales.
16
17
18
Aplicacin
Visaje Technology
http://www.l1id.com/pages/18
FaceKey Corp.
http://www.facekey.com/
Cognitec Systems
http://www.cognitecsystems.de/
ImageWare Sofware
http://www.iwsinc.com/
19
20
Face Unlock es una aplicacin que permite a los usuarios de mviles con
Android cambiar el desbloqueo del equipo mediante clave por el
reconocimiento de la cara. Previamente el sistema tiene una etapa de
entrenamiento por la cual almacena imgenes de la persona utilizando la
cmara frontal del dispositivo.
21
22
23
24
25
Con respecto a la separacin en horizontal de las cmaras, llamada distancia base (ver
figura 3.1.1.2), en el momento de definirla se tuvo en cuenta que afecta a la
determinacin de la profundidad. Segn [Mazo Quintas, 2005] El error de
profundidad es inversamente proporcional a la distancia base, por esta razn, a
mayor distancia base mejor es la estimacin de profundidad dado que el error
disminuye. Sin embargo, el aumentar demasiado esta distancia es contraproducente
dado que ira disminuyendo la zona de visin comn entre ambas cmaras,
dificultando la puesta en correspondencia de puntos homlogos en las imgenes.
Mediante una buena relacin base profundidad se optimiza esta situacin.
26
Y
X
Z
(a)
(b)
Figura 3.1.1.3 - (a) Ejes cartesianos utilizados. (b) Software de calibrado de la
cmara.
27
28
29
30
31
32
33
34
35
Figura 4.1.1 distancia geodsica (azul) vs. distancia euclidea (rojo) obtenida de
[Karima Ouji et al, 2008]
36
Estos caminos geodsicos son los ms cortos y estn gobernados por tres propiedades:
Interior a un triangulo,
Un camino corto debe ser una lnea recta, cuando se cruza un borde,
Un camino corto debe corresponder a una lnea recta si las dos caras
adyacentes son no plegadas en un plano comn.
Para realizar el clculo computacional de la distancia geodsica, cada borde de la
malla se divide en un conjunto de intervalos llamados ventanas (windows). Las
ventanas son luego propagadas a travs de la malla mediante el algoritmo de Dijsktra.
(c)
37
Todos Origen, Todos Destinos (GeoAll): En este caso se toman todos los
vrtices del modelo de a uno por vez y se calculan las distancias geodsicas a
todo el resto. (Figura 4.1.4)
Figura 4.1.4 distancia geodsica del modelo todos origen, todos destinos
En ambos mtodos los caminos geodsicos, que son una sucesin de lneas rectas
sobre los tringulos de la malla facial desde un punto a otro, se guardan como
informacin junto con el valor de la medicin total de distancia.
38
Estas distancias entre todos los puntos de la cara se utilizaran luego para comparar y
verificar si se reconoce o no a la persona que desea ingresar en el punto de control de
acceso.
39
[Xio jo-1 , Yio jo-1 , Zio jo-1 ] [Xio jo, Yio jo , Zio jo ] [Xio jo+1, Yio jo+1, Zio jo+1 ]
[Xio+1 jo-1, Yio+1 jo-1, Zio+1 jo-1] [Xio+1 jo,Yio+1 jo , Zio+1 jo ] [Xio+1 jo+1,Yio+1 jo+1, Zio+1 jo+1]
[ecu. 4.2.1]
[Xio jo, Yio jo , Zio jo ] es el vrtice del modelo de la cara y los vecinos se determinan
tomando los 8 puntos alrededor al realizar la proyeccin de la superficie en el plano
X-Y sobre un grillado de 1mm (ver figura 4.2.2). Luego se obtiene la coordenada Z
al volver a proyectar en el plano tridimensional.
X (i, j ) = i
[ecu. 4.2.2]
Y (i, j ) = j
[ecu. 4.2.3]
Z (i, j ) = f (i, j ) [ecu. 4.2.4]
Figura 4.2.2 Grillado de la superficie con el punto P00 marcado en el centro y sus vecinos
Para obtener el valor de Z, es necesario identificar en que triangulo del modelo 3D cae
el punto. Por lo tanto se debe verificar si el punto es interno a un triangulo dado,
teniendo en consideracin siguiente definicin.
Consideremos un triangulo ABC y un punto P del plano. P est en el interior de este
tringulo si la orientacin de los tringulos ABP, BCP y CAP es la misma que
la orientacin del tringulo ABC.
A
C
Figura 4.2.3 punto p interior a un triangulo
40
N .P ax by
[ecu. 4.2.9]
c
Luego en base a estos valores se busca una funcin paramtrica de la superficie que
pase por los nueve puntos
S (u, v) = [ Px(u, v), Py (u, v), Pz (u, v)] [ecu. 4.2.10]
Siendo Px(u,v) , Py(u,v) , Pz(u,v) los polinomios de menor grado.
Luego se obtienen las derivadas de las funciones mediante las siguientes ecuaciones:
S
1
1
Pi 0, j 01 + Pi 0, jo +1
(i0 , j 0 ) =
u
2
2
S
1
1
(i0 , j 0 ) = Pi 01, jo + Pi 0+1, j 0
v
2
2
[ecu. 4.2.11]
[ecu. 4.2.12]
41
2S
(i0 , j0 ) = Pi 0, j 01 2Pi 0, j 0 + Pio, jo +1 [ecu. 4.2.13]
u 2
2S
(i0 , j0 ) = Pi 01, jo 2 Pio, jo + Pi 0+1, jo
v 2
[ecu. 4.2.14]
Si las derivadas parciales son continuas se supone que las cruzadas son iguales y se
pueden obtener con la siguiente formula
2S
1
1
1
1
(i0 , j 0 ) = Pi 01, jo 1 Pi 01, j 0+1 Pi 0+1, j 01 + Pi 0+1, j 0+1 [ecu. 4.2.15]
uv
4
4
4
4
Con estos valores se calculan las curvaturas principales de la superficie buscando las
races de la ecuacin cuadrtica del paraboloide osculador con origen en el punto p.
( D.D' ' D' 2 ).R 2 ( E.D ' '2.F .D '+G.D).R + ( E.G F 2 ) = 0 [ecu. 4.2.16]
Expresin cannica que permite encontrar las races R1 y R2 de la ecuacin
2 z = R1.x 2 + R2 . y 2
[ecu. 4.2.17]
1 1
1
+
[ecu. 4.2.18]
2 R1 R2
1
R1.R2
[ecu. 4.2.19]
42
43
44
En el anlisis discriminante existen dos tipos de variables, las dependientes (Y) que
representan el grupo y las variables independientes (X) que representan las
caractersticas que describen a los grupos.
El LDA solo es aplicable si los grupos son linealmente separables, es decir, que
puedan ser separados por una combinacin lineal de las caractersticas que describen a
los objetos.
Lo que se va a buscar es la probabilidad de que un objeto pertenezca a un determinado
grupo, lo cual se puede expresar P(i|x) > P(j|x) j i , siendo P(i|x) la probabilidad
de que el objeto pertenezca al grupo i dado el conjunto x, lo mismo para P(j|x) pero
con el grupo j.
En la prctica, es ms sencillo obtener P(x|i) que representa la probabilidad de tener
cierto conjunto de caractersticas sabiendo que el objeto pertenece a la clase i.
Haciendo uso del teorema de Bayes podemos obtener la probabilidad buscada segn
la formula
P(i | x) =
P (i ) P( x | i)
[ecu. 5.1.1]
P( x | j ) P( j )
j
1
i C 1 iT + ln( pi ) [ecu. 5.1.2]
2
( xi ) t xi
[ecu. 5.1.4] matriz de covarianza del grupo i siendo xi = xi [ecu.
ci =
ni
5.5] con media global de cada una de las caractersticas
45
La formula [ecu. 5.1.2] se aplica por cada sujeto x k al querer reconocerlo y para todos
los grupos posibles obtenindose un f i por cada grupo, con lo cual se termina
asignando cada sujeto al grupo que tenga el valor mayor.
En el caso prctico tenemos nicamente dos grupos para clasificar, en un grupo, que
se llamara Reconocido, se encuentra el modelo del rostro a identificar que existe
previamente en la base y en otro grupo, llamado No Reconocido, todos los restantes
modelos de caras que conforman la base. Las caractersticas segn el caso sern las
mediciones de distancias geodsicas o de curvaturas gaussianas que se tomaron sobre
los MNSF.
Primeramente los MNSF se representan en una matriz M, con tantas filas como
individuos se encuentren en la base y tantas columnas como caractersticas se utilicen
para comparar como se muestra en la figura 5.1.1. Esta matriz se arma de forma de
juntar el grupo No Reconocido en la parte superior, que seran los rostros de los
individuos de la base que no son a quin quiero reconocer y el otro grupo,
Reconocido, en la parte inferior, conformado por el rostro en la base del individuo que
quiero reconocer, por lo tanto sera solo una fila dado que se ha tomado un solo
modelo en la base por cada individuo. Es posible tomar varios modelos de base por
cada individuo, sobre todo en los casos que se quieran tener en cuenta distintas
expresiones faciales a fin de mejorar el reconocimiento.
M=
Figura 5.1.1 Matriz conformada en las filas por los individuos de la base y en las columnas por la
medicin de las caractersticas. Hay dos grupos: la superior conformada por los MNSF de los
individuos de la base que no son la persona a reconocer, la inferior conformada por el MNSF que existe
en la base del individuo a identificar
Luego se calcula la media total de cada caracterstica (figura 5.1.2), por lo tanto ser
la media total por columnas de la matriz, y tambin se calculan la media de cada
grupo 1 y 2 , es decir por columna pero solo teniendo en cuenta las pertenecientes al
mismo grupo.
1
M=
46
M1
M=
-
M2
Figura 5.1.3 Matrices de cada grupo luego de restar la media global.
M 2t xM 2
[ecu. 5.1.7]
nro. filasM 2
[ecu. 5.1.8]
Con la inversa C 1 , 1 y 2 aplicamos la [ecu. 5.1.2] siendo los xk los valores de las
caractersticas del individuo a identificar, es decir los valores que se calculan en el
momento del reconocimiento.
Para cada MNSF del rostro a identificar obtenemos como resultados un valor f1 y un
f 2 representando los grupos No Reconocido y Reconocido respectivamente.
f1 : indica que pertenece al grupo No Reconocido conformado por los modelos de
rostros de la base que no son de la persona que quiero identificar
f 2 : indica que pertenece al grupo Reconocido conformado por el modelo del rostro
que esta en la base y pertenece a la persona que quiero identificar.
Si f1 <= f 2 concluimos que ese modelo de la base podra ser la persona que quiero
identificar, en caso contrario no es la persona. En la figura 5.1.4 la lnea de f 2 solo
supera el valor de f1 en el individuo que se toma como reconocido, en este caso el
nmero 1. En el resto de los individuos se mantiene por debajo, en algunos casos
alejndose bastante y en otros ms prximos, indicando que en esos casos las
caractersticas son bastante semejantes en ambas personas pero no lo suficiente para
reconocerla como la misma.
47
Reconocimiento LDA
1050
Valor
1000
950
f1
f2
900
850
800
17
15
13
11
750
Individuo
Figura 5.1.4 reconocimiento por LDA
48
j =
1 n
(Ei j ) [ecu. 5.2.3]
n 1 1
En el caso ideal, que las mediciones fueran exactamente iguales, la media debera dar
cero ya que la diferencia entre el valor medido de cada caracterstica es el mismo, con
lo cual el error cuadrtico medio sera cero en todas las caractersticas.
En la prctica, en general, las mediciones difieren, por lo tanto se presupone que el
sujeto de la base que mejor se aproxima al que quiero reconocer es el que presenta
menor valor de la media general. Sin embargo, es posible que otro sujeto de la base
que no sea el que intento reconocer tenga una media similar o menor al sujeto real,
por eso se utiliz un umbral igual al desvi standard, para permitir una tolerancia en el
reconocimiento de las caras.
Como al realizar la autenticacin se conoce a priori, cual es el modelo de la base
contra el que debe ser identificado, si el mismo es el que tiene el valor menor de
media o esta dentro del radio de tolerancia se lo toma como reconocido sino se
considera que no pudo ser reconocida la cara.
49
6 Verificacin experimental
Se dispone de 30 imgenes de prueba, algunas con su MNSF incluido en la base, o
sea, la galera de conocidos y otras que no forman parte de la misma a fin de efectuar
el reconocimiento y evaluar el desempeo de los algoritmos desarrollados.
Se aplicaron en todos los casos de prueba los tres algoritmos de reconocimiento facial
desarrollados (Curvaturas, GeoOne, GeoAll) y se experimento la variacin del
desempeo de los mismos modificando la probabilidad de pertenecer a cada grupo al
aplicar el algoritmo de LDA y la variacin ante la inclusin o no de un umbral de
tolerancia al implementar el algoritmo de comparacin por cuadrados mnimos.
Los resultados sern analizados mediante la curva ROC (Receiver Operating
Characteristic), una herramienta que permitir comparar y seleccionar el algoritmo
ptimo utilizando los valores de dos caractersticas operativas como son la tasa de
verdaderos positivos (TVP) contra la tasa de los falsos positivos (TFP). Como se
define en Curva ROC Wikipedia, the free encyclopedia. La TVP mide hasta qu
punto una prueba diagnstica es capaz de detectar los casos positivos correctamente,
de entre todos los casos positivos disponibles durante la prueba, y la TFP define
cuntos resultados positivos son incorrectos de entre todos los casos negativos
disponibles durante la prueba. Tambin se evaluar la precisin de cada mtodo para
realizar su comparacin de desempeo, la cual esta definida por la siguiente frmula
Pr ecisin( ACC ) =
VP + VN
[ecu. 6.1]
P+N
VP = Verdaderos positivos
VN = Verdaderos Negativos
P = total casos positivos
N = total casos negativos
50
grupo 2 = 0,5
grupo 2 = 0,9
TVP
TFP
Precisin
TVP
TFP
Precisin
TVP
TFP
Precisin
GeoOne
0,6
0,2
0,7
0,6
0,2
0,7
0,8
0,2
0,8
GeoAll
0,6
0,47
0,57
0,6
0,53
0,53
0,6
0,53
0,53
Curvatura
0,06
0
0,53
0,4
0,13
0,63
0,6
0,13
0,73
Tabla 6.1 comparacin del desempeo de los mtodos en base a la variacin del umbral al utilizar
LDA.
Luego se vario la probabilidad de los grupos a 0,5 para ambos. Como se observa en la
tabla 6.1, se obtuvo que la medicin de curvaturas aumento a un 40% TVP, con lo
cual el mtodo mejoro, su precisin llega al 63% pero an no lo suficiente para ser
confiable. Por otro lado, se verific que el algoritmo LDA pudo realizar
correctamente la separacin de grupos de los modelos de la base.
En cuanto a los otros dos mtodos de aplicacin de distancias geodsicas, an cuando
se vario la probabilidad de los grupos, la precisin de ambos mtodos se mantuvo, lo
mismo su tasa de reconocimiento TVP en 60% y tambin la TFP
Por ltimo, se modifico el valor de la probabilidad del grupo 2 subindola a 0,9 y el
grupo 1 bajndola a 0,1 obteniendo los resultados indicados en la ltima fila de la
tabla 6.1.
En cuanto a los mtodos de distancias geodsicas, GeoAll se mantuvo invariable la
tasa de reconocimiento TVP en un 60% y TFP en un 53%, prcticamente igual que en
los casos previos. Sin embargo, GeoOne mejoro su desempeo al aumentar a 80% la
tasa de reconocimiento TVP siendo el nivel ms alto obtenido entre los algoritmos
desarrollados en este trabajo y mantuvo baja la TFP en 20%. La precisin de 80% de
GeoOne es de las ms altas obtenidas.
En el mtodo de curvaturas se mejoro notablemente el nivel de reconocimiento
llegando a un 60% TVP y con un bajo nivel TFP del 13%. Su precisin supero a
GeoAll llegando a un 73%, convirtindolo en el segundo mejor mtodo en lo que
respecta a este trabajo.
En la figura 6.1 se grafic la variacin de la precisin de cada mtodo en base a la
variacin del umbral, pudiendo observarse que GeoOne llega al valor mayor del 80%
51
geoall
grupo2 = 0.05
curvatura
grupo2 = 0.5
grupo2 = 0.9
TVP
0.2
0.4
0.6
0.8
TFP
geoone
geoall
curvatura
Figura 6.2 Curva ROC de los tres mtodos segn la variacin del umbral aplicando LDA
Se pueden observar en el grfico de la figura 6.2 las curvas ROC para cada mtodo
ante la variacin del umbral. Con GeoOne vemos que TVP aumenta hasta un 80% en
el mejor caso mientras que TFP se mantiene constante en 20%. Esto indica que el
mtodo es confiable, es decir, podr reconocer satisfactoriamente a las personas y
52
adems evitar los intentos de accesos fraudulentos. Por ser el que tiene el valor ms
cercano al extremo superior izquierdo, donde se encontrara el mtodo ideal, se lo
considera el ms ptimo.
Por el contrario en GeoAll tenemos unos valores de curva muy prximos a la diagonal
en donde se considera que es un mtodo azaroso. Su tasa de reconocimiento de casos
positivos verdaderos es muy prxima a la tasa de reconocimiento de casos falsos
positivos, por lo tanto no es un mtodo til dado que tiene alta probabilidad de no
identificar casos fraudulentos de identidad.
En contraposicin, tenemos al mtodo de curvaturas que va mejorando con el
aumento del umbral, llegando a TVP 60% como GeoAll, pero tiene una TFP
significativamente menor del 13%, grficamente puede observarse como la curva esta
ms alejada de la diagonal y es ascendente. Por esta razn este mtodo llega a una
precisin del 73% superando a GeoAll.
Al aplicar el mtodo de comparacin por error cuadrtico medio en los algoritmos
desarrollados se utiliz el mismo grupo de prueba con el fin de luego poder cotejar los
resultados con los obtenidos mediante la aplicacin de LDA.
La primera corrida de reconocimiento por error cuadrtico medio fue con un umbral
cero, es decir, sin tolerancia. En base a los datos de la tabla 6.2, se concluye que las
probabilidades de reconocimiento de casos positivos verdaderos son demasiado bajas.
El peor desempeo lo tiene curvaturas con TVP 13,3%, seguido por GeoOne con un
TVP 27% y GeoAll, con la tasa de reconocimiento superior de 40%, que no llega a un
valor aceptable.
Umbral
sin umbral
con umbral
TVP
TFP
Precisin
TVP
TFP
Precisin
GeoOne
0,27
0
0,63
0,67
0,27
0,7
GeoAll
0,4
0,13
0,63
0,73
0,4
0,67
Curvatura
0,13
0,07
0,53
0,4
0,33
0,53
Tabla 6.2 comparacin de mtodos con cuadrados mnimos sin umbral de tolerancia
Variando el umbral de modo que sea igual al desvi standart de cada individuo, es
decir, permitiendo que la cara a reconocer se encuentre dentro de un radio prximo
delimitado por el valor del desvi standard de la misma, se observa de la tabla 6.2,
que las probabilidades de reconocimiento TVP aumentan considerablemente.
En el caso de curvatura se llega a un 40%, lo cual mejora sustancialmente el caso
previo pero an no llega a tener un nivel que lo haga un mtodo aceptable, dado que
TFP del 33% es un valor similar. Se observa en la curva ROC de la figura 6.4 como se
aproxima a la diagonal haciendo que sea un mtodo azaroso en sus resultados.
Con GeoOne se obtiene una tasa TVP del 67% mejorando notablemente los 27%
obtenidos al no tener un umbral de aceptacin, su nivel de precisin llega a un 70%
haciendo que sea el mtodo ms confiable al aplicar error cuadrtico medio.
53
El mayor ndice TVP de reconocimiento llega a 73,3% con GeoAll, pero a diferencia
de GeoOne tiene tambin un alto ndice TFP del 40%, por lo cual su precisin es
menor, pues tiene mayor probabilidad de reconocer falsos positivos que en el caso de
GeoOne.
geoall
sin umbral
curvatura
con umbral
Figura 6.3 Comparacin de precisin de los mtodos con error cuadrtico medio
TVP
0.2
0.4
0.6
0.8
TFP
geoone
geoall
curvatura
Figura 6.4 - Curva ROC de los tres mtodos segn la variacin del umbral aplicando error cuadrtico
medio
En la figura 6.3 se observa como la precisin de todos los mtodos aumenta con la
aplicacin de un umbral en el caso de comparacin con error cuadrtico medio, y
tiene el mayor valor el mtodo GeoOne. Incluso en la curva ROC de la figura 6.4 se
puede ver como la curva de este mtodo se encuentra por encima de las dems y ms
prxima al mtodo ideal. Por otro lado, GeoAll aumenta levemente su precisin pues
54
55
GeoOne
80%
70%
GeoAll
53%
67%
Curvatura
73%
53%
56
Con los mtodos de reconocimiento del presente trabajo podemos decir que la
medicin y comparacin mediante curvatura de gauss, aplicando la comparacin
mediante error cuadrtico medio tiene un bajo nivel de precisin 53%, observando del
anlisis de la curva ROC que su comportamiento es casi azaroso.
En el caso de aplicar la comparacin mediante LDA se observa que la respuesta es
muy sensible a la variacin de la probabilidad de cada grupo. Incluso no es aplicable
LDA cuando la probabilidad del grupo a reconocer es muy baja, debido a que no
puede realizarse una correcta separacin de grupos entre los modelos de la base.
La curvatura de gauss utilizando como mtodo de comparacin LDA, no llega a un
buen nivel de reconocimiento aceptable en el mercado actual, en el mejor caso
presenta una precisin del 73%, por lo cual su utilidad podra ser orientada a buscar
similitudes en caras pero no para reconocimiento.
Por otro lado, las distancias geodsicas demostraron tener un alto nivel de
reconocimiento, incluso se puede observar que no por agregar ms puntos de la cara
para comparacin se obtienen mejores resultados, dado que GeoAll obtiene menores
niveles de probabilidad que GeoOne, utilizando menos puntos de comparacin.
El mtodo LDA en ambos algoritmos de distancias geodsicas es aplicable, pues an
con los cambios en la probabilidad de grupo, se hace una correcta separacin de los
modelos de la base en todos los casos.La precisin no es tan sensible a la variacin
del umbral de probabilidad de grupo, para GeoAll se mantiene constante casi cercano
al 60% y en el caso de GeoOne se mantiene en 70% y llega a su mximo del 80%
cuando la probabilidad del grupo a reconocer es superior.
El mtodo GeoAll utilizando LDA como mtodo de comparacin tiene una
probabilidad de reconocimiento TVP constante de 60% y una probabilidad TFP de
permitir accesos fraudulentos cercana al 40%, por lo tanto, no es un mtodo confiable,
de su curva ROC puede observarse que se aproxima a un mtodo azaroso.
En cuanto al mtodo GeoOne utilizando comparacin mediante LDA llega al ms alto
nivel de reconocimiento de los algoritmos desarrollados en este trabajo, con una
precisin del 80%, teniendo una alta tasa de reconocer personas verdaderas y una tasa
baja de permitir accesos con identidad fraudulentas. De esta manera se convierte en el
mtodo aconsejado para aplicar en el reconocimiento facial en base al anlisis de este
trabajo.
En el caso de la comparacin de las distancias geodsicas con el mtodo de error
cuadrtico medio tomando un umbral de tolerancia, los niveles varan de forma que
GeoAll alcanza una probabilidad de precisin del 67% y GeoOne disminuye a 70%.
Por lo tanto, la diferencia entre si no es muy distante, de la curva ROC se puede
observar que ambas estn muy prximas y tienen un comportamiento similar ya que
TVP aumenta proporcionalmente con su TFP, siendo GeoOne el que tiene mejores
resultados pues la relacin de incremento es menor.
En el presente trabajo solo se tuvo en cuenta el manejo de rostros con expresin
neutra, una futura mejora sera profundizar en el manejo de expresiones faciales uno
de los puntos difciles de enfrentar para el reconocimiento tridimensional. En el
estudio de [Haar et al, 2008] se propone trabajar con la parte invariante de la cara
57
conformada por el triangulo formado por la punta de la nariz y los dos ojos, lo cual
quita informacin del modelo pero habra que evaluar en cuanto se modifica el
porcentaje de reconocimiento y si ayuda a superar el problema de las expresiones
faciales. De todas formas, en el estudio de [Gupta et al, 2007], se indica que las
distancias geodsicas son un mtodo robusto para las expresiones faciales, as tambin
se seala en [Bronstein et al, 2005] donde ambos aseguran que las deformaciones en
la cara debido a las expresiones faciales pueden ser modeladas como isometras, de tal
manera que las propiedades geomtricas intrnsecas de la superficie facial permanecen
invariantes frente a los cambios debido a las expresiones, salvo en los casos de boca
abierta que generan demasiada variacin en el modelo y por lo cual quedan fuera del
alcance en ambos trabajos.
Basados en la idea de la deformacin isomtrica de la cara, podra extenderse la base
actual de este trabajo incluyendo tomas de los sujetos con expresiones faciales para
verificar si se mantiene o vara la tasa de reconocimiento de los mtodos GeoOne y
GeoAll.
Otro de los puntos importantes a tener en cuenta a futuro es la bsqueda de puntos
homlogos en forma totalmente automtica, dado que es fundamental al momento del
armado del MNSF. En nuestro caso se utilizo un algoritmo automtico con la
posibilidad de acomodar los puntos obtenidos para controlar los casos donde el
apareo no era ptimo, pero se podra profundizar en la forma de hacer uso del
conocimiento de la distribucin de la cara y de la posible ubicacin de los 20 puntos
que se localizan para conformar el MNSF a fin de mejorar el apareo estereoscpico y
que sea totalmente automtico y fiable.
En cuanto al mtodo de comparacin LDA, se podran utilizar varias imgenes de la
persona para conformar el modelo en la base y comprobar como influye en los
resultados de reconocimiento, dado que este mtodo mejora con el aprendizaje. Como
as tambin se podran evaluar los resultados que se obtengan con otros mtodos de
comparacin.
58
59
8 Glosario
Apareo Estereoscpico: consiste en la identificacin de puntos correspondientes en
un par de imgenes estereoscpicas.
Camino geodsico: La curva con la menor longitud al tomar una distancia entre dos
puntos de una superficie
Distancia Geodsica: es la longitud de una curva que representa el camino ms corto
entre dos puntos de una superficie.
Dpi (dot per inch): tambin conocido como pxel por pulgada (ppp) es una medida
utilizada en las mquinas que indica los puntos que entran en una pulgada para
representar una imagen.
Deformaciones isomtricas: una transformacin de una superficie que mantiene las
medidas.
Estereoscopa: es toda tcnica utilizada para generar una imagen tridimensional a
travs de informacin visual del entorno.
Falso positivo: denominado error tipo I en estadstica, dado que es el error que se
comete al identificar como positivo un caso que debera ser negativo.
Geodsica discreta: una distancia geodsica conformada por una secuencia de lneas
rectas en la superficie.
Mtodo biomtrico: mtodos para el reconocimiento nico de humanos basados en
uno o ms rasgos conductuales o rasgos fsicos intrnsecos.
Mtodo invasivo: es un procedimiento donde se aplican tcnicas que invaden el
cuerpo de una persona
Modelo digital de la cara (MDC): es una representacin numrica de las
caractersticas del rostro a partir de las coordenadas tridimensionales de los puntos
que lo definen. Se aproxima una superficie real y continua, como es el rostro, a una
superficie matemtica discreta formada por superficies elementales planas
triangulares
Modelo numrico 3D de superficies faciales (MNSF): es la representacin
numrica del rostro mediante el conjunto de puntos obtenidos al realizar el apareo
estereoscpico.
Puntos homlogos: puntos en las imgenes, correspondientes al mismo punto en el
espacio objeto.
Proporciones antropomtricas: En base a [Gupta et al, 2007] las proporciones
antropomtricas crneo-faciales son promedios de pares de lneas rectas a lo largo de
distancias sobre la superficie entre puntos especficos craneales y faciales. Estas
proporciones faciales cuantifican las relaciones entre diferentes subpartes de las caras
78630 - Pamela Alejandra Pereyra
60
humanas, y son ampliamente utilizadas en arte y escultura como guas para crear
rostros ideales bien proporcionados, en antropometra para analizar a los humanos
prehistricos, para cuantificar el atractivo facial, para analizar desproporciones
faciales en anomalas y como una ayuda para planear cosmtica facial y cirugas
reconstructivas. Y, ltimamente, para crear modelos de caras humanas en
computacin grafica, como en el caso de los videojuegos.
Visin binocular: es todo tipo de visin donde se utilizan dos dispositivos para
obtener imgenes del entorno, puede ser una visin simple donde se tienen dos
imgenes por separado o ms compleja con fusin binocular, como los seres
humanos, llamada visin estreo.
Visin Estreo : es la visin realizada a travs de dos dispositivos que enfocan a un
rea comn y permiten la reconstruccin tridimensional de la misma. Por ejemplo, los
ojos de los seres humanos y varios animales funcionan de esta forma.
Verdadero Positivo: en estadstica se le llama a los casos que se identifican como
verdaderos y se comprueban que realmente lo son.
61
9 Anexos
9.1 Calibracin de una cmara digital: mtodo simplificado
Se suponen 2 cmaras digitales, sean C1 : cmara 1 y C2 : cmara 2, colocadas de
manera que ambas enfoquen en paralelo una cuadrcula de 10 cm de lado; el eje
principal, de ambas normal a la cuadrcula y sus ejes principales pasando por puntos
de la cuadrcula separados de 10 cm. La cmara 2 estar 10 cm ms cerca de la
cuadrcula que la cmara 1 (ver figura 9.1.1). De esta manera la base, vector que
separa ambas cmaras, ser:
B = (100, 0, 100) [ecu. 9.1.1]
La distancia de centro ptico de la cmara 1 a la cuadrcula se medir con la mayor
precisin posible.
La rotacin de la segunda cmara respecto de la primera es la identidad debido a la
manera en que se supusieron colocadas las cmaras.
1 0 0
R = 0 1 0 [ecu. 9.1.2]
0 0 1
Eje y
y
Eje x
M
y
Eje z
S1
S2
P1
C1
V1
V2
P2
C2
62
b2
b1 [ecu. 9.1.4]
0
b3
0
b1
Ya que:
~
BR.V2 = B.R.V2 [ecu. 9.1.5]
Matriz Fundamental
r
Ahora bien, el vector de la cmara 1, w1 expresado en pixeles ser:
= x + 0 [ecu. 9.1.7]
= y + 0 [ecu. 9.1.8]
Y en forma matricial se puede expresar como:
r
w1 = = 0
1
0
x + 0 . f
f x
f
x + 0
0
0
y = y + . f = y + 0 [ecu. 9.1.9]
f
f
1
1
1
.f
f
f
63
x=
0
[ ecu. 9.1.10]
y=
0
[ ecu. 9.1.11]
( )
x
= y [ ecu. 9.1.12]
f
0 0
; ; f = (u
1). 0
0
1
0 [ecu. 9.1.13]
64
[ecu. 9.2.1]
De lo cual obtenemos
X =
Y=
X 1Z
[ecu. 9.2.2]
F1
Y1 Z
[ecu. 9.2.3]
F1
[ecu. 9.2.4]
De lo cual obtenemos
65
X 2Z
[ecu. 9.2.5]
F2
y adems
N=
Y=
Y2 Z
[ecu. 9.2.6]
F2
X1Z
[ecu. 9.2.8]
F1
que al reemplazar por el despeje de N (ecu. 9.2.5) obtenido nos queda
B+N =
B+
X 2 Z X 1Z
[ecu. 9.2.9]
=
F2
F1
La distancia focal de ambas cmaras es la misma dado que son del mismo modelo,
salvo defectos de fabricacin que se consideraron despreciables. Entonces tenemos
que F = F1 = F2 por lo que al calcular la coordenada Z despejando de la ecuacin
10.2.9 tenemos
Z=
BF
[ecu. 9.2.10]
(X1 X 2 )
X 1Z
[ecu. 9.2.11]
F
Y=
Y1 Z
[ecu. 9.2.12]
F
Se debe tener en cuenta que Y1 = Y2 dado que las cmaras se localizan a la misma
distancia desde la imagen en base a una calibracin.
De esta manera se obtienen las coordenadas tridimensionales (X,Y,Z) de cada uno de
los puntos homlogos seleccionados en el modelo y sobre los cuales se construye el
MNSF.
66
Problema encontrar Mq = Y
Z
Z
Y
q
X
z
S
p
v
y
Mq(X,Y,Z)
Ms(x,y,z)
q ( X , Y , Z ) Referencial general
S ( x, y, z ) Referencial imagen
Se tiene que
SM s = R(qM q qS )
[ecu. 9.3.1]
67
Xs
Siendo R una matriz de rotacin y S = Ys un vector de traslacin.
Z
s
De lo cual se deduce que el punto puede expresarse de la siguiente manera:
x
X Xs
Ms = y = R Y Ys
z
[ecu. 9.3.2 ]
Zs
x
=U
z
[ecu. 9.3.3]
Despejando u y v se obtiene
x
u=
[ecu. 9.3.5]
z
v=
y
= V [ecu. 9.3.4]
z
[ecu. 9.3.6]
Despejando x e y se obtiene
u
v
x = z [ecu. 9.3.7]
y = z [ecu. 9.3.8]
x
z =0
z
[ecu. 9.3.9]
y
z = 0 [ecu. 9.3.10]
z
x
X
Xs r11r12 r13 X L1
y = R Y R Ys = r21r22 r23 Y + L2 [ecu. 9.3.11]
z
Zs
r31r32 r33 Z
L3
[ecu. 9.3.15]
[ecu. 9.3.16]
68
Mq =
UL3 L1
VL3 L2
Son conocidos U =
T1
T2
[ecu. 9.3.23]
[ecu. 9.3.24] ,
V =
Incgnitas Mq = ( X , Y , Z )
69
Dado un conjunto de puntos P donde existe una triangulacin de esos puntos tal que
la circunferencia circunscripta de cualquier tringulo no contenga ningn vrtice de
otro tringulo.
Propiedad 1 (En Crculo)
Figura 9.4.1 - La propiedad de En Crculo. Figura obtenida de [Priego de los Santos et al, 2006]
70
Figura 9.4.2 - Propiedad ngulo max. min. Figura obtenida de [Priego de los Santos et al, 2006]
71
[ecu. 9.5.1]
r u r v [ecu. 9.5.2]
El valor W esta dado por
( r r o ). n [ecu. 9.5.3]
El desarrollo de Taylor sera
W=
1
D (uo , vo ).h 2 + 2.D' (uo , vo ).h.k + D' ' (uo , vo ).k 2 + O ( 2 )
2
[ecu. 9.5.4]
1
D(uo , vo ).h 2 + 2.D' (uo , vo ).h.k + D' ' (uo , vo ).k 2
2
] [ecu. 9.5.5]
D = r 11 . n =
D' = r 12. n =
( ruu , ru , rv ) d
= [ecu. 9.5.6]
(ruv , ru , rv ) d '
=
[ecu. 9.5.7]
D' ' = r 22 . n =
Siendo
72
d =
2x
u 2
x
u
x
v
2y
u 2
y
u
y
v
2x
uv
x
d '=
u
x
v
2y
uv
y
u
y
v
2x
v 2
x
d ''=
u
x
v
2y
v 2
y
u
y
v
2z
u 2
z
u
z
v
[ecu. 9.5.9]
2z
u v
z
u [ecu. 9.5.10]
z
v
2z
v 2
z
u
z
v
[ecu. 9.5.11]
x y z
2
E = r1 = + + [ecu. 9.5.12]
u u u
F = r1.r2 =
x x y y z z
. + . + . [ecu. 9.5.13]
u v u v u v
2
x y z
2
G = r2 = + + [ecu. 9.5.14]
v v v
73
D
D'
D'
D' ' [ecu. 9.5.16]
2 z = A. x 2 + C. y 2 [ecu. 9.5.24]
La curvatura Sophie GERMAIN (promedio) en el punto M es obtenida por la
expresin:
S .G. = A + C [ecu. 9.5.25]
El punto puede ser clasificado en elptico, hiperblico o parablico de acuerdo con los
tres siguientes casos respectivamente:
Elptico: AC > 0
Hiperblico: AC <0
Parablico: AC = 0
78630 - Pamela Alejandra Pereyra
74
75
10 Referencias y bibliografa
Akarun, L., Gokberk, B., Salah, A. A. 3D Face Recognition for Biometric
Applications. Department of Computer Engineering. Bogazici University, Bebek,
Istanbul, Turkey
Android Ice Cream Sandwich review , web Slash Gear. En lnea. Accedido 12 de
septiembre del 2013.
http://www.slashgear.com/android-ice-cream-sandwich-review-21196969/
76
77
78
Phillips, P. J., Todd Scruggs, W., OToole, A. J., Flynn, P. J., Bowyer, K. W., Schott,
C. L., Sharpe, M: FRVT 2006 and ICE 2006 Large-Scale Results. Marzo 2007.
Priego de los Santos, J. E., Porres de la Haza, M. J. La triangulacin de Delaunay
aplicada a los modelos digitales del terreno. Departamento de Ingeniera
Cartogrfica, Geodesia y Fotogrametra. Universidad Politcnica de Valencia. En
lnea. Accedido 20 de noviembre 2013
http://age.ieg.csic.es/metodos/docs/doc1_8.pdf.
Reyes Enciso, A. S., Neumannb, U., Mah, J. 3D head anthropometric analysis. SPIE
Symposium on Medical Imaging. 2003, San Diego, CA, USA.
Rios, Javier Eslava. Reconocimiento Facial En Tiempo Real. rea de Tratamiento de
Voz y Seales. Dpto. de Ingeniera Informtica. Escuela Politcnica Superior
Universidad Autnoma de Madrid. Julio 2013. En lnea. Accedido 5 diciembre 2013.
http://arantxa.ii.uam.es/~jms/pfcsteleco/lecturas/20130717JavierEslavaRios.pdf.
Samani, A., Winkler, J., Nirajan, M. Automatic Face Recognition Using Stereo
Images. Acoustics, Speech and Signal Processing. ICASSP 2006. Proceedings. 2006
IEEE International Conference on Volume 5, Issue , 14-19 May 2006 Page(s):V V.
The University of Sheffield, Department of Computer Science, Sheffield S1 4DP,
UK, 2006
Sanchez Moreno, F. M. Reconstruccin 3D con iluminacin lser: Aplicaciones a la
fotogrametra industrial. Capitulo 3: Visin 3D estereoscpica. 2000
Seguridad futurista Seguridad futurista: cajeros Globalnet reconoceran rostro de
En
lnea.
Accedido
12
de
septiembre
del
2013.
usuarios.
http://elcomercio.pe/economia/peru/seguridad-futurista-cajeros-globalnetreconocerian-rostro-usuarios-noticia-1493707
Shu-Wei Lin, Shu-Shen Hao, Jui-Lun Chang, Sheng-Yi Li. 3D Face Recognition
Based on Curvature Feature Matching, with Expression Variation. Intelligent
Autonomous Systems 12, Volume 1 Proceedings of the 12th International Conference
IAS-12, held June 26-29, 2012, Jeju Island, Korea, pp 289-299.
Sirovich, L. Kirby, M. A Low-Dimensional Procedure for the Characterization of
Human Faces. J. Optical Soc. Am. A, 1987, Vol. 4, No.3, 519-524.
Sigari M. H., Rahmani A. T. Optimized Elastic Bunch Graph Matching using Genetic
Algorthim for Face Recognition. 2007. En lnea. Accedido 20 de septiembre del 2013.
http://confbank.um.ac.ir/modules/conf_display/conferences/isfs2007/pdf/i441.pdf
78630 - Pamela Alejandra Pereyra
79
Surazhsky, V., Surazhsky, T. Kirsanov, D., Gortler, S., Hoppe, H. Fast Exact and
Aproxmate Geodesics on Meshes. ACM. SIGGRAPH 2005, pp. 553560 (2005)
Teknomo, Kardi. Discriminant Analysis Tutorial. 2006. En lnea. Accedido 20 de
septiembre del 2013.
http://people.revoledu.com/kardi/tutorial/LDA/
Turk, M., and Pentland, A., Eigenfaces for recognition. Journal of Cognitive
Neuroscience. Vol, 3. pp. 71-86. 1991.
Welling, M. Fisher Linear Discriminant Analisys. Department of Computer Science.
University of Toronto. 2008 . En lnea. Accedido 20 de septiembre del 2013.
http://www.ics.uci.edu/~welling/classnotes/papers_class/Fisher-LDA.pdf
Wiskott, L. Fellous, J. M., Krger, N., von der Malsburg, C. Face Recognition by
Elastic Bunch Graph Matching. In Intelligent Biometric Techniques in Fingerprint
and Face Recognition, eds. L.C. Jain et al., publ. CRC Press, ISBN 0-8493-2055-0,
Chapter 11, pp. 355-396, 1999
Zelasco, J. F., Mndez, D. E., Donado, A. V. Estereopsis automtica panorama del
estado del arte. Anales de la Sociedad Cientfica Argentina. 1998.
Zhao, W., Chellappa, R., Rosenfeld, A, Phillips, P. J.. Face Recognition: A Literature
Survey, ACM Computing Surveys. 2003. pp. 399-458.
Zhao, H., Yuen, P. C. Incremental Linear Discriminant Analisys for Face
Recognition. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND
CYBERNETICSPART B: CYBERNETICS, VOL. 38, NO. 1, FEBRUARY 2008.
80