ADMINISTRACION

UNIVERSIDAD DE BUENOS AIRES
FACULTAD DE INGENIERIA
Reconocimiento Facial
Mediante Imgenes Estereoscpicas
Para Control de Ingreso
Tesis de Grado de Ingeniera en Informtica
Autor:
Pamela Alejandra Pereyra (papereyra@gmail.com)
Padrn:
78630
Tutor:
Lic. Jos Francisco Zelasco
Cotutor:
Lic. Judith Donayo
Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso
78630 - Pamela Alejandra Pereyra
Universidad de Buenos Aires
Tabla de Contenidos
1 Introduccin ... 4
1.1 Motivacin ... 5
1.2 Estructura de la tesis 6
2 Estado del arte ... 8
2.1 Comienzos de la estereoscopa 9
2.2 Historia del reconocimiento facial ... 10
2.2.1 Clasificacin de los mtodos de reconocimiento facial . 12
2.3 Reconocimiento 3D .. 13
2.3.1 Tcnicas de obtencin de modelos 3D 15
2.3.2 Mtodos de reconocimiento facial 3D . 16
2.3.3 Aplicaciones comerciales desarrolladas ...... 19
2.3.4 Casos de implementaciones de sistemas .. 19
de reconocimiento facial
3 Captura y armado del modelo 3D .. 24
3.1 Captacin de imgenes estereoscpicas Modelo pinhole ..... 24
3.1.1 Descripcin de la toma de las fotografas 25
3.2 Modelo 3D del sistema facial ... 27
3.2.1 Puesta en correspondencia de puntos homlogos 28
3.2.2 Triangulacin de Delaunay 30
4 Soluciones propuestas para el reconocimiento facial . 34
4.1 Distancias geodsicas 34
4.2 Curvaturas de superficies .. 39
5 Algoritmos de comparacin de modelos faciales 44
5.1 LDA: Anlisis Discriminante Lineal . 44
5.2 Error cuadrtico medio 48
6 Verificacin experimental .. 50
7 Conclusiones, limitaciones y futuras lneas de investigacin 56
8 Glosario .. 60
9 Anexos . 62
9.1 Calibracin de una cmara digital : mtodo simplificado 62
9.2 Configuracin normal de dos cmaras: Clculo de las coordenadas del
punto objeto ..... 65
9.3 Configuracin general de dos cmaras: Clculo de las coordenadas del
punto objeto. Caso general. 67
9.4 Propiedades de la triangulacin de Delaunay 70
9.5 Desarrollo de la obtencin de las curvaturas de superficie . 72
10 Referencias y bibliografa ..... 76
1 Introduccin
Los seres humanos se reconocen entre s por medio de los rostros, se puede decir que
se almacenan en la memoria las imgenes de las caras de gente que se conoce. Para
ello, se tienen en cuenta los rasgos caractersticos que permiten identificarlas.
Generalmente se logra el reconocimiento an con cambios importantes producto del
paso del tiempo, el uso de accesorios y maquillaje entre otros. Esta capacidad es
excelente para reconocer caras de conocidos, aunque no es tan buena cuando se trata
de caras poco familiares.
El progreso computacional de las ltimas dcadas, permiti automatizar el
reconocimiento facial modelizando los mecanismos de la percepcin visual de los
seres humanos con el objeto de poder emplearlo en diversos campos de aplicacin,
principalmente, en los casos que se requiere mejorar la seguridad a todo nivel.
En la actualidad los mtodos biomtricos para el reconocimiento de las personas
resultan de sumo inters, debido a que los mtodos convencionales, como solicitar
algn documento de identidad, el uso de una tarjeta electrnica o contrasea personal,
no son ni suficientemente seguros, ni prcticos.
El reconocimiento facial biomtrico es un mtodo interesante dada su caracterstica de
no invasivo, por lo cual puede ser usado incluso sin el conocimiento y colaboracin
del sujeto. Adems, un reciente estudio sobre el reconocimiento facial humano versus
el computacional, realizado por [Phillips et al, 2007] demostr que sobre una misma
muestra de personas, los sistemas de reconocimiento facial, desarrollados en la ltima
dcada, se han perfeccionado al punto de ser capaces de alcanzar los mismos niveles
que los mecanismos del ser humano y son mejores a la hora de detectar falsos
positivos, es decir, casos donde una cara se da por reconocida contra otra que no es la
correspondiente. Esto se debe a que en la respuesta perceptiva intervienen factores
subjetivos. Sin embargo, los sistemas automticos no son de todos modos
suficientemente confiables debido a diversos factores que afectan su eficiencia como
por ejemplo, la iluminacin de las imgenes, deformaciones gestuales, cambios
fisonmicos (barba bigote cirugas), uso de accesorios o adornos (anteojos aros),
el punto de vista, oclusiones, escala de la imagen, entre otros. Por esta razn, la
mayora de los sistemas actuales exigen ciertas restricciones para funcionar
correctamente. Pese a ello, diversos estudios realizados demuestran que an sirven
como apoyo de la seguridad.
Actualmente se busca mejorar la calidad del reconocimiento facial a travs del uso de
datos tridimensionales (3D), dado que los mismos son menos sensibles que los
bidimensionales, a los cambios de luz, variaciones de postura en la imagen,
maquillaje y expresiones faciales (a condicin que se tomen ciertos puntos de la cara).
Los modelos tridimensionales faciales proveen informacin sobre caractersticas de la
superficie de la cara, que varios de los nuevos algoritmos estn utilizando para
optimizar el reconocimiento facial.
Este trabajo se orienta al reconocimiento de las caras a partir de sus modelos

numricos 3D, obtenidos por tcnicas de estereoscopa. En este caso, los modelos
numricos de una misma cara si bien deben ser intrnsicamente idnticos pueden
haber sido obtenidos en cada caso con la cara ubicada en posicin diferente respecto
del referencial del mecanismo de toma. Es por esta dificultad que aqu se busca
comparar los modelos numricos identificando sus propiedades intrnsecas, es decir,
propiedades independientes del referencial, y no por medio de una roto-traslacin que
superponga las caras que se quieren comparar.
Este desarrollo apunta a hacer robusta la etapa de reconocimiento por medio de
modelos numricos 3D de las superficies faciales (MNSF). Se identifica si la persona
est o no autorizada comparando las propiedades intrnsecas del MNSF elaborado a
partir de la imagen estereoscpica obtenida, con las propiedades intrnsecas de los
MNSF que se encuentran en la base o galera de conocidos, logrando as un control de
acceso automtico.
1.1 Motivacin
El reconocimiento facial es un mtodo biomtrico que tiene un vasto campo de
aplicacin en el mundo tecnolgico de la actualidad, en especial, en lo que respecta a
la seguridad.
Por ejemplo, podra ser utilizado en menor escala en sistemas de acceso para las
empresas, reconocimiento de amigos en las redes sociales, bsqueda de caras por
similitud, identificacin en un celular o computadora, acceso a cajeros automticos. Y
a gran escala, podra ser instrumentado por las autoridades para la localizacin de
personas buscadas, control de pasaportes, seguridad en calles, en estadios de ftbol,
en recitales o en aeropuertos.
Los mecanismos automticos de reconocimientos de caras ms conocidos en la
actualidad consisten en comparar imgenes monoculares de las mismas. Esto puede
ser insuficiente dado que el ngulo de toma y los cambios faciales por motivos como,
por ejemplo, la iluminacin, postura, expresin facial, uso de maquillaje y uso de
accesorios dificultan la identificacin.
En el desarrollo de este trabajo, con el objetivo de generar un mtodo de
reconocimiento facial con un alto nivel de efectividad se utilizarn MNSF buscando
mejorar la respuesta ante los posibles problemas de cambios, particularmente pero no
exclusivamente, debido al ngulo de toma. De todas maneras, seguirn presentndose
limitaciones a la hora de realizar los reconocimientos dado que se trabaja con caras
tomadas en condiciones normales o neutrales, es decir sin expresiones particulares, y
sin oclusiones. Queda, entonces la posibilidad de realizar extensiones de este trabajo
con diferentes orientaciones.
Se utilizaron dos criterios para la obtencin de propiedades intrnsecas que
permitieron comparar los MNSF. Estas caractersticas invariantes del MNSF no
dependen del sistema al que estn referidos los puntos que conforman el modelo, por
lo que permiten comparar MNSF tomados en distintos momentos. Para ello es

necesario seleccionar puntos caractersticos de las caras, siempre los mismos en todas
las imgenes que sern utilizados para el clculo de las coordenadas de los puntos
seleccionados y que determinarn el MNSF.
Los criterios adoptados son:
Por medio de distancias geodsicas:
Se miden distancias geodsicas entre los puntos que conforman los modelos MNSF.
Se comparan estas distancias con las distancias homlogas correspondientes a cada
MNSF de la base.
Por medio de curvaturas de superficie (curvaturas de Gauss):
Se calcula la curvatura de Gauss en cada punto seleccionado del MNSF y se compara
con los valores homlogos de cada MNSF que se encuentra en la base.
1.2 Estructura de la tesis

En la figura 1.2.1 se describen los pasos comunes a seguir en un proceso de
reconocimiento de rostros. En primer lugar, tenemos la adquisicin de la imagen, que
en este caso ser una imagen estereoscpica y se obtendr a travs de dos cmaras
calibradas y ubicadas de manera ortonormales, los ejes de toma paralelos y normales
al segmento que une los puntos de vista de las cmaras y las lneas de pxeles
paralelas a dicho segmento. Este tema se retomar en la seccin 3.1.
Luego se calculan las coordenadas tridimensionales, a partir de la ubicacin de puntos
homlogos, puntos en las imgenes, correspondientes al mismo punto en el espacio
objeto. La identificacin de los puntos homlogos se realizar con asistencia manual
en ambas imgenes a fin de minimizar el efecto de una mala puesta en
correspondencia y asegurar de manera independiente la evaluacin de los algoritmos
propuestos.
A continuacin se ejecuta la triangulacin bidimensional del modelo utilizando el
algoritmo de Delaunay para obtener el MNSF como una superficie discreta formada
por superficies elementales planas triangulares. Este proceso ser explicado en la
seccin 3.2.
Con el MNSF de cada individuo, se proceder al clculo de los valores de las
propiedades caractersticas utilizando distancias geodsicas y curvaturas gaussianas.
En la seccin 4.1 se explica de qu manera se determinan y aplican las distancias
geodsicas y en la seccin 4.2 cmo se calculan las curvaturas gaussianas, en este
caso, dado que nos encontramos con una superficie faceteada en tringulos.
Por ultimo, en el captulo 5 se detalla cmo se realiza la comparacin con el resto de
los individuos incorporados previamente en la galera, es decir, la base de caras.
Como resultado de la aplicacin del algoritmo de comparacin, se obtiene la
identificacin o no del rostro ingresado.
En el captulo 6 se realiza un informe de verificacin experimental de los resultados

obtenidos y luego, en el captulo 7 se detallan las conclusiones y las futuras lneas de
investigacin.
Figura 1.2.1 - Pasos a seguir para el reconocimiento de rostros
2 Estado del arte [Pereyra, P. et al, 2013]

El progreso computacional de las ltimas dcadas, permiti automatizar el
reconocimiento facial modelizando los mecanismos de la percepcin visual de los
seres humanos con el objeto de poder emplearlo en diversos campos de aplicacin
(Tabla 2.1), siendo principalmente en los casos que se requiere mejorar la seguridad.
En la actualidad los mtodos biomtricos para el reconocimiento de las personas
resultan de sumo inters, debido a que los mtodos convencionales, como de solicitar
algn documento de identidad, el uso de una tarjeta electrnica o contrasea personal,
no son ni suficientemente seguros, ni prcticos.
El reconocimiento facial es un mtodo biomtrico interesante dada su caracterstica
particular de no invasivo, por lo cual puede ser usado incluso sin el conocimiento y
colaboracin del sujeto.
Diversas tcnicas se han implementado a fin de realizar un reconocimiento facial.
Siendo el reconocimiento mediante modelos 3D uno de los ltimos caminos que se ha
abordado y con mayor expectativa de xito.
reas
Entretenimiento
Aplicaciones Especificas
videos juegos, realidad virtual,
programas de entrenamiento,
interaccin robot-humano
Tarjetas Inteligentes
Licencias de conducir,
programas de ayuda social
pasaporte, documento de
identidad nacional, registracin
de voto, fraudes en asistencia
social
supervisin adulta de TV,
ingreso a sesin en dispositivo
porttil y/o PC
seguridad en aplicaciones,
seguridad en base de datos,
encriptacin de archivos,
seguridad intranet, acceso a
internet, registros mdicos,
seguridad en terminales
comerciales
control CCVT, vigilancia
avanzada por video ,
robo en tiendas, seguimiento e
investigacin de sospechoso
Seguridad de la Informacin
Aplicacin de la ley y vigilancia
Tabla 2.1 Aplicaciones tpicas de reconocimiento facial segn [Zhao et al, 2003]
2.1 Comienzos de la estereoscopa

La humanidad, desde sus comienzos, ha pretendido representar las imgenes de su
alrededor en forma tridimensional [Fernndez Snchez, 2000]. Es el caso de los
primeros pintores en las famosas cuevas de Lascaux, datadas de 16.000 aos. En la
cueva francesa, bajo la luz tenue de la antorcha, pueden tomar una calidad
tridimensional las representaciones de ciervos, bfalos u otras escenas de animales
como se muestra en la figura 2.1.1.
Figura 2.1.1 - Pintura de cueva de Lascaux en Francia.

Figura obtenida de Cuevas de Lascaux Wikipedia, the free encyclopedia
El inters por el fenmeno de la tridimensionalidad visual se remonta a la Grecia

clsica. En el siglo III A.C. el matemtico griego Euclides, estudi en su tratado
titulado "ptica" la relacin entre la visin en relieve y el hecho de que los seres
humanos dispongan de dos ojos. Ya en el siglo II de nuestra era, el mdico griego
Galeno describira tambin lo que supuso una profundizacin de una teora razonada
de la visin de la perspectiva a travs de los dos ojos. Supo, por observacin, que si se
tapaba un ojo, la imagen del entorno cambiaba ligeramente [Fernndez Snchez,
2000].
Sera en 1833 cuando se descubre un dispositivo notablemente sencillo que reproduce
la tridimensionalidad: El estereoscopio de Charles Wheatstone (ver figura 2.1.2), un
fsico escocs que trabaj antes de que se inventara la fotografa, fue el primer y
principal avance que conducira a toda una larga cadena de aparatos e invenciones
para ver en relieve. Dicho estereoscopio constaba de dos espejos colocados en ngulo
con respecto al observador y una imagen situada frente a cada espejo. Wheatstone
lleg a la conclusin de que las diferencias visuales, que presentan ambos ojos eran el
origen de la percepcin en relieve.
Pocos aos despus, David Brewster, un cientfico e inventor escocs, dise y
construy la primera cmara fotogrfica estereoscpica, con la que obtuvo las
primeras fotografas en relieve. Y construy tambin un visor con lentes para
observarlas. [Fernndez Snchez, 2000].
Figura 2.1.2 - Estereoscopio de Charles Wheatstone.

Figura obtenida de La vida en 3D
2.2 Historia del reconocimiento facial

El reconocimiento facial es un concepto relativamente nuevo, las primeras
investigaciones se remontan a la dcada de 1950 en el rea de la psicologa (Bruner y
Tagiuri 1954), y a la dcada de 1960 en la literatura ingenieril (Bledsoe 1964). Este
concepto hace referencia a la accin de reconocer a una persona mediante su rostro,
teniendo en cuenta todas las caractersticas posibles que puedan visualizarse o
medirse.
En los primeros trabajos, en los aos 60, segn [Duane Blackburn et al, 2006], las
tcnicas desarrolladas eran un sistema semiautomtico para reconocimiento facial que
requera de un administrador (la persona que lo utilizaba), para localizar rasgos
(ojos, orejas, nariz, boca) en las fotografas. Y se comparaban las distancias medidas
entre los puntos de referencia elegidos. Este es el caso del proyecto de Bledsoe, donde
una persona utilizando una tabla RAND tomaba coordenadas de distintos puntos en
una fotografa como por ejemplo, el centro de las pupilas, los bordes internos y
externos de los ojos, entre otros. Y se realizaban mediciones de unas 20 distancias:
ancho de la boca, ancho de los ojos, distancia entre pupilas. Esta informacin se
asociaba al nombre de una persona y pasaba a formar parte de la base de caras. Luego
en el proceso de identificacin se comparaban las distancias de la nueva fotografa
con los datos de la base y se retornaba la ms cercana.
En el trabajo de Goldstein, Harmon, & Lesk (1971), se usaron 21 marcadores
subjetivos especficos tales como el color del cabello, grosor de labios, largos de las
orejas, los cuales eran medidos por un operador en cada fotografa, y luego el sistema
se encargaba de comparar estas medidas para realizar el reconocimiento facial.
Recin en la dcada de 1970 comenz la idea de implementar un reconocimiento
facial automtico a diferencia del semiautomtico que se venia utilizando. El trabajo
de [Kanade, 1973] se baso en analizar las imgenes mediante un programa encargado
de procesar las imgenes para obtener caractersticas faciales de manera automtica,
entre ellos estaban la nariz, los borde de los ojos, boca, mentn. Luego se utilizaban
distancias eucldeas ponderadas entre estos puntos a fin de medir la similitud entre las
caras y realizar as su reconocimiento.
10
En 1987 Kirby & Sirobich aplicaron una tcnica del lgebra lineal llamada anlisis de
componentes principales (PCA, Principal Component Analysis), al problema del
reconocimiento facial. Con lo que demuestran que cualquier cara puede ser
representada por la mezcla de un conjunto de caras que conforman una base llamadas
eigenpictures, con un error de hasta 3%. Lo cual fue considerado hito en la
materia al mostrar que eran requeridos menos de 100 valores para cifrar
acertadamente la imagen de una cara convenientemente alineada y normalizada.
En 1991 [Turk & Pentland, 1991] basndose en las investigaciones de Kirby &
Sirobich, utilizan el PCA, en una tcnica que fue conocida como eigenfaces, y se
convirti en un estndar de comparacin de la performance de los nuevos algoritmos
para el reconocimiento de rostros.
El mtodo se basa en tomar un conjunto de caras de entrenamiento con las cuales se
define una cara promedio, los vectores de distancia de las caras a la cara promedio
son sujetos a PCA para obtener los autovalores y autovectores ortonormales que
mejor describen la distribucin de datos. Son estos autovectores los llamados
eigenface, que se utilizan luego para mediante una combinacin lineal definir una
cara.
Al querer reconocer una nueva imagen de una cara, esta se proyecta en el espacio de
caras y se obtienen su combinacin lineal. Para determinar a que clase pertenece se
minimiza la distancia eucldea con cada clase, y si esta debajo de cierto umbral se la
clasifica perteneciente a dicha clase y sino no se la reconoce. Adems el algoritmo
puede detectar si no se identifico porque no es una cara o porque la cara es nueva, con
lo cual da la opcin de agregarla a la base.
De todos los algoritmos utilizados en el campo del reconocimiento facial 2D, existen
tres algoritmos que son los ms estudiados y aplicados por sus ptimos resultados
como se seala en [Zhao et al, 2003]: Anlisis de componentes principales (PCA Principal Componen Analysis), el Anlisis Lineal Discriminante (LDA Linear
Discrimant Analysis) y Correspondencia entre Agrupaciones de Grafos Elsticos
(EBGM - Elastic Bunch Graph Matching).
El mtodo de anlisis de componentes principales (PCA), es el ms conocido y como
se menciono anteriormente se ha tomado como parmetro de comparacin para los
nuevos algoritmos. Y el trabajo ms reconocido utilizando esta tcnica es el realizado
por [Turk & Pentland, 1991] con sus reconocimiento facial mediante Eigenfaces.
De acuerdo con [H. Zhao et al, 2008] varios mtodos de reduccin de dimensiones
han sido aplicados en el campo de reconocimiento facial con xito. Fisher Linear
Discriminant Analisys ( FLDA) , una versin de LDA, es uno de los ms populares,
pero hay varias otros mtodos basados tambin en LDA que se han aplicado con
buenos resultados, y que buscaron superar las falencias de FLDA como ser el
problema de singularidad conocido como Small Simple Size ( SSS ), dado cuando hay
una sola imagen por cada individuo.
Bsicamente LDA, como se indica en [Duane Blackburn et al, 2006], es una tcnica
de clasificacin de datos que mediante una aproximacin estadstica busca clasificar
muestras de clases desconocidas basadas en ejemplos de entrenamiento con clases
conocidas. Esta tcnica busca maximizar la varianza entre las clases (between-class),
es decir entre las caras de cada persona distinta, as como tambin minimizar la
varianza de cada clase (within-class), es decir entre caras de un mismo individuo.
11
En el estudio realizado por [Belhumeur et al, 1997] se utilizo FLDA para implementar
el reconocimiento de rostros con FisherFaces, y se lo comparo con el mtodo
Eigenfaces, obteniendo como resultado que el mtodo FisherFaces es mejor a la hora
de lidiar simultneamente con la variacin de luz (incluye intensidad, direccin y
nmero de fuentes de luz) y expresiones faciales.
Como se detalla en [Sigari et al, 2007] en el mtodo EBGM, se definen varios puntos
especficos de la cara (como ser esquinas de los ojos, punta de la nariz, etc) que van a
ser los mismos aun cuando vari la postura. Y mediante la aplicacin de un filtro de
transformacin Gabor, se procesa la imagen y se crea una arquitectura que proyecta el
rostro sobre una grilla elstica. Cada nodo de la grilla es conocido como jet gabor,
que describe el comportamiento de la imagen alrededor de un pxel. El modelo
obtenido para cada imagen de la cara con los jet gabor se denomina image graph.
Se genera con algunos de los modelos que conforman la galera de entrenamiento, que
tienen la misma postura, un grfico genrico con la combinacin de varias caras
llamado face bunch graph(FBG), el cual se utiliza para generar el image graph de
nuevas caras, ayudando de esta manera a ubicar los puntos especficos. Al inicio esto
se realiza en forma manual, pero a medida que se enriquece el modelo con caras de
entrenamiento se hace en forma automtica este reconocimiento de puntos en las
imgenes de las nuevas caras.
Para realizar el reconocimiento se compara el image graph de la nueva cara a
reconocer, contra todos los modelos de la galera de entrenamiento basndose en una
funcin de similitud. Esta funcin de similitud puede formularse de distintas formas,
siempre teniendo presente que es la responsable de que se realice un buen
reconocimiento.
Por ejemplo en [Wiskott et al, 1999] se ha tomado esta funcin de similitud como un
promedio de la similitud entre pares de jets correspondientes.
2.2.1 Clasificacin de los mtodos de reconocimiento facial

En general, varios son los mtodos que se han propuesto para llevar adelante un
reconocimiento facial, al ser un problema tan interesante, investigadores de varias
ramas han intervenido en el mismo, por lo cual la literatura sobre el tema es vasta y
diversa. Por este motivo, es difcil realizar una clasificacin de los mtodos existentes
pero entre las posibles, se adoptara la indicada en [Zhao et al, 2003] donde se pueden
identificar tres clases a un nivel alto: los holsticos, los basados en caractersticas y los
hbridos.
Segn [Zhao et al, 2003] los holsticos, utilizan toda la regin de la cara y han
demostrado ser efectivos en experimentaciones con grandes bases de datos (por
ejemplo: eigenface - fisher faces). Los basados en caractersticas, buscan obtener
caractersticas locales como los ojos, la boca, la nariz y utilizan un clasificador
estructural. Estos han sido exitosos y comparados con los holsticos son menos
sensibles a las variaciones de luminosidad, puntos de vista y a inexactitudes en la
localizacin de la cara, sin embargo las tcnicas de extraccin de caractersticas
necesitan ser confiables y precisas para poder obtener una buena respuesta en el
reconocimiento facial.
12
En el caso de los hbridos, se utiliza un sistema de percepcin ms similar al humano,

ya que combinan mtodos holsticos con mtodos de caractersticas faciales, lo cual
potencialmente podra obtener lo mejor de ambos, pero no es un campo en el que se
haya profundizado.
En la tabla 2.2.1.1 se puede observar la clasificacin indicada y los mtodos ms
utilizados de cada clase.
Mtodo
Holsticos
Trabajos
Principal Component Anlisis (PCA)
Eigenface
Probabilistic eigenface
Fisherfaces / subspace LDA
SVM
Evolution pursuit
Features lines
ICA
Otros
LDA / FLD
PDBNN
Basados en Caractersticas
Pure geometry methods
Dynamic link architecture
Hidden Markov model
Convolution Neural Network
Hbridos
Modular eigenface
Hybrid LFA
Shape-normalized
Component-based
Tabla 2.2.1.1 - Categorizacin de Mtodos sobre Imgenes Estticas segn [Zhao et al, 2003]
2.3 Reconocimiento 3D
Existi un test de evaluacin para los algoritmos comerciales y prototipos de tcnicas
de reconocimiento facial, llamado Face Recognition Vendor Test (FRVT) realizado
por The Nacional Institute of Standarts and Technology (NIST), cuyas evaluaciones
fueron realizadas en el 2000, 2002 y 2006 por ltima vez. Mediante el anlisis de
estas pruebas realizadas se pudo obtener informacin para determinar como las
tcnicas de reconocimiento facial pueden ser mejoradas y recomendar futuras
direcciones de investigacin.
Como resultado de la ltima evaluacin realizada en el 2006, como seala [Phillips et
al, 2007], se obtuvo que desde 1993 al 2006 se ha mejorado en dos rdenes de
magnitud el porcentaje de error (ver figura 2.3.1). Para realizar la comparacin se
utiliza el estudio realizado con eigenfaces de [Turk & Pentland, 1991]. Tambin se
han tenido en cuenta para medir el avance de los algoritmos, los resultados de las
evaluaciones del test Face Recognition Technology (FERET), que fuera realizado
previamente en 1994, 1995 y 1996.
13
Figura 2.3.1 - La reduccin en el promedio de error para los algoritmos de reconocimiento de rostros
en base a las evaluaciones de FERET, FRVT 2002 y FRVT 2006.
Figura obtenida de [Phillips et al, 2007]
En base al anlisis, tambin se concluyo, como indica [Bowyer et al, 2005], que el
actual estado del arte del reconocimiento facial 2D es insuficiente para la alta
demanda biomtrica de las aplicaciones, a partir de lo cual intentar usar informacin
3D se ha vuelto la direccin de bsqueda emergente con la esperanza de hacer que el
reconocimiento facial sea ms exacto y robusto.
Por esta razn, a pesar de que histricamente es muy poco el trabajo realizado en esta
rea, en los ltimos aos han aumentado ampliamente las investigaciones usando
informacin 3D.
Actualmente, la mayora de los estudios de reconocimiento facial 3D se han orientado
hacia el uso de tcnicas holsticas o de tcnicas de apareo de superficies 3D. [Gupta et
al, 2007]. Entre los mtodos holsticos se encuentran por ejemplo PCA, LDA, que
representan un avance de las tcnicas que fueron bastante exitosas con imgenes 2D.
Incluso el algoritmo 3D PCA es, tambin, considerado como un referente de
evaluacin de la performance de otros algoritmos de reconocimiento facial 3D.
14
De acuerdo con la totalidad de la bibliografa sobre reconocimiento facial, se admite

que los factores circunstanciales de los cuales depende la apariencia facial son los que
se deben tomar en consideracin para obtener resultados satisfactorios. Entre ellos
tenemos luminosidad, escena de fondo, postura de la cabeza, pelo facial, uso de
maquillaje, joyas, piercings, cirugas plsticas, proceso de envejecimiento, aumento y
disminucin de peso, expresiones faciales, resolucin de las imgenes, entre otros. Si
se busca la geometra tridimensional del rostro como en [Bronstein et al, 2005] se
representa la estructura anatmica interna de la cara, en vez de su apariencia externa,
que es influenciada por los nombrados factores del entorno. Por lo cual, las
superficies faciales 3D son insensitivas a la iluminacin, postura de la cabeza y
cosmticos, aunque, por ejemplo, siguen teniendo problemas con las expresiones
faciales, pero mejoran el reconocimiento y, en general, se ha encontrando que tienen
mejor desempeo que algunos algoritmos de 2D.
2.3.1 Tcnicas de obtencin de modelos 3D

Para obtener los modelos 3D faciales se pueden utilizar distintas tcnicas entre ellas:
Escner Facial (Laser Facial Scanning): genera un modelo 3D detallado y registrando
la textura de la cara, pero requiere la cooperacin del individuo por varios minutos
mientras el escner recorre alrededor de su cabeza. Generalmente requiere un
tratamiento extra la imagen por el ruido que obtiene. No es un mtodo muy utilizado
debido a su alto costo. Recientes investigaciones fueron realizadas sobre modelos 3D
de las caras, obtenidos mediante escneres de lser, como sucede en las tomas
realizadas para la base de datos de caras BJUT-3D llevada a cabo por la universidad
de Beijing [Chinese Face Database, 2005]. Estos modelos, aunque son bastante
exactos, necesitan la cooperacin de la persona, insumen largos tiempos en la
realizacin del escaneo y algunos presentan limitaciones, como por ejemplo, la
necesidad de tapar el pelo, por lo cual es necesario que la persona utilice un gorro de
natacin. Esta mayor cooperacin e interaccin de la persona es una desventaja que
anula el principal factor por el cual el reconocimiento facial es ms requerido, su uso
sin necesidad de cooperacin del individuo en cuestin.
Tomografa Computada (Computed Tomography Scan) : tiene un alto costo y el sujeto
debe exponerse a radiacin, por lo cual tampoco es un mtodo con una amplia
aplicacin.
Estereoscopa (Stereo-photogrammetry): es una tcnica pasiva donde mediante el uso
de dos o ms cmaras debidamente calibradas se obtiene la reconstruccin
tridimensional de la superficie facial. Presenta dificultades por la necesidad de una
correcta calibracin.
Pero por otro lado tiene la ventaja de no ser intrusiva para el sujeto y no requiere la
cooperacin del mismo.
El uso de la estereoscopa para la obtencin de un modelo tridimensional facial es ms
viable y sencillo, dado que se puede realizar a partir de dos imgenes normalizadas, la
toma se hace casi instantneamente y el equipo necesario a utilizar es de muy bajo
costo comparado con un escner tridimensional. Sin embargo, [Samani et al, 2006]
apunta como desventaja que si bien varias de las tcnicas estereoscpicas utilizadas
reportaron una exactitud por encima del 90%, una precisa calibracin de las cmaras
fue necesaria. Lo cual resulta difcil realizar fuera de las condiciones de laboratorio,
por lo que se degrada la reconstruccin y posterior reconocimiento.
15
Luz estructurada (Structure Ligth imaging system): se usa la proyeccin de un patrn

de luz conocido para obtener las coordenadas 3D a partir de una sola imagen. Es un
mtodo rpido y barato, pero como debilidad de este mtodo se tiene que las regiones
mal iluminadas pueden generar prdidas de datos y el resplandor causado por el
proyector es molesto para los individuos.
2.3.2 Mtodos de reconocimiento facial 3D

Entre los mtodos de reconocimiento facial tridimensionales, podemos distinguir dos
grandes grupos en base a la informacin que utilizan:
3D Puro
Son las tcnicas que utilizan solo informacin de imgenes tridimensionales. En la
tabla 2.3.2.1 se detallan algunos de los estudios realizados utilizando solo figuras 3D.
Tabla 2.3.21 - Algoritmos de reconocimiento facial utilizando 3D [Bowyer et al, 2005]
3D Multimodal
Son las tcnicas que utilizan la informacin conjunta de imgenes tridimensionales y
bidimensionales. Como se seala, en el estudio realizado por [Bowyer et al, 2005]
sobre mtodos 3D multimodales, no fue hasta el ao 2000 que se empezaron a evaluar
algoritmos que combinan resultados de datos en 2D y 3D. La forma ms comn es
utilizar separadamente los datos 2D y 3D para luego combinar los resultados. En
general, en base a los resultados reportados dicha combinacin tiene una respuesta
mucho mejor que cuando se utilizan las mismas tcnicas 2D y 3D por separado. Ver
tabla 2.3.2.2 para un detalle de las investigaciones sobre los mtodos multimodales.
16
Tabla 2.3.2.2 - Algoritmos usando combinacin de datos 3D y 2D [Bowyer et al, 2005]
Otra posible clasificacin de los sistemas de reconocimiento facial 3D se basa en la

forma de representacin de la cara teniendo en cuenta lo descrito por [Gkberk,
2006], que esta influenciado por lo especificado en [Akarun et al, 2005]. Se pueden
definir unos 5 grupos:
-
Nube de puntos ( Point Clouds)

La superficie facial es representada mediante una nube de puntos 3D, que son
un conjunto de muestras en coordenadas (x,y,z). Es la forma ms bsica de
representacin as como tambin la ms difcil de trabajar.
El mtodo ms utilizado con esta forma de representacin es ICP ( Iterative
Closest Point) en el cual dadas dos nubes de puntos de distintas caras, el
algoritmo busca mediante rotacin y traslacin en forma iterativa alinear un
modelo al otro. Una de las desventajas de este algoritmo es el alto costo
computacional que tiene comparar cada cara de prueba con la galera de caras
a fin de realizar el reconocimiento.
Koudelka [Gkberk, 2006] primeramente localiza varios puntos especficos
de la cara como la punta de la nariz, centro de la boca y bordes de los ojos
entre otros, y luego toma 150 puntos al azar cercanos. Con estos puntos se
realiza la comparacin utilizando una mezcla de los algoritmos ICP y
Hausdorff.
Medioni y Waupotitsch [Bowyer et al, 2005] utilizan ICP en imgenes
estereoscpicas para un sistema de autenticacin obteniendo un error bajo
(menos del 2%) en el reconocimiento realizado sobre una base de 100
personas con 7 imgenes por cada individuo.
Imgenes de profundidad ( Depth Images)

Se utiliza la intensidad de las imgenes en 2D para obtener la profundidad.
Cada pxel en la imagen de profundidad representa la distancia del punto 3D a
la cmara.
Con las imgenes de profundidad el problema de reconocimiento facial 3D
pueden ser tratado como un problema de 2D, por lo cual pueden utilizarse
cualquiera de los algoritmos anteriormente mencionados para el
reconocimiento 2D como han de ser PCA, LDA.
17
Entre los mtodos de reconocimiento facial 3D multimodal con imgenes

estereoscpicas tenemos el uso de composite image, segn Samani et al,
(2006) donde se utiliza informacin de intensidad y profundidad para obtener
el modelo de la cara y luego se aplica el mtodo de reconocimiento de
eigenface.
En este mtodo adems de la imagen 2D con sus valores de intensidad, se usa
una imagen llamada 2 D, donde la profundidad se codifica directamente en
la imagen 2D, los valores de los pxeles se corresponden con la misma. Esta
representacin permite utilizar las tcnicas de reconocimiento de imgenes 2D.
La tcnica eigenface se aplica en la imagen 2D, 2 D y en el espacio
compuesto (formado por ambas imgenes 2D y 2 D), obtenindose como
resultado que la precisin del reconocimiento es menor que la citada en otros
estudios, lo cual se aduce a que no se ha tenido extenso cuidado en el proceso
de adquisicin de datos. Los resultados obtenidos tambin evidencian que en
el espacio compuesto, donde se combina informacin de intensidad y
profundidad se obtienen mejores niveles de reconocimiento que en los casos
que se utiliza la informacin por separado.
-
Curvas Faciales ( Facial Curves)

Se extraen curvas verticales, horizontales y del contorno de la superficie facial
y se representa la misma utilizando caractersticas obtenidas de dichas curvas
2D.
Como primer trabajo en el campo tridimensional podemos ubicar el realizado
por Cartoux en 1989, segn [Bowyer et al, 2005]. En el mismo se realiza una
segmentacin de una imagen de rango basndose en la curvatura principal para
encontrar un plano bilateral de simetra de la cara, el cual se utilizaba para
normalizar la pose de la misma.
Luego se utilizan mtodos para comparar los perfiles desde el plano de
simetra y con la superficie de la cara.
Gordon como se describe en [Bowyer et al, 2005], propuso un mtodo basado
en curvaturas, donde se extraen un conjunto de caractersticas que describen
curvatura y mediciones de la cara. Cada cara se transforma en un punto en el
espacio de caractersticas y se realiza una comparacin de vecino cercano.
Geometra Diferencial (Differential Geometry)

Se utiliza geometra diferencial para obtener caractersticas de la superficie
que son invariantes ante transformaciones como rotacin y traslacin.
En el trabajo de [Gupta et al, 2007] con modelos 3D se localizan manualmente
unos 25 puntos antropomtricos y se toman distancias eucldeas y geodsicas
entre los mismos. Estos puntos fueron seleccionados en base al trabajo
realizado por Farkas, donde se observa que son los que presentan mayor
variacin entre los individuos con lo cual ayudan a realizar el reconocimiento
de los mismos.
Luego se clasifica el reconocimiento de una cara mediante la aplicacin de
LDA entre los modelos.
18
Entre las conclusiones se indica por un lado, que el reconocimiento es mejor si

se utilizan estos puntos antropomtricos que agregan conocimiento extra de la
cara, que si se utilizan puntos arbitrarios. Y por otro lado, que la utilizacin de
distancias geodsicas hace al algoritmo ms robusto frente a las expresiones
faciales, ya que como las mismas pueden ser modeladas como deformaciones
isomtricas de superficie facial, entonces las propiedades intrnsecas se
mantienen constantes como es el caso de la distancia geodsica.
-
Geometra basada en caractersticas faciales ( Geometrical Features)

Como en los inicios del reconocimiento facial 2D, se ubican varias
caractersticas faciales como la punta de la nariz, ojos y boca y se obtienen
distintas mediciones de las mismas como ngulos, distancias, longitudes.
2.3.3 Aplicaciones comerciales desarrolladas

En la tabla 2.3.3.1 se detallan algunas empresas que ofrecen aplicaciones de
reconocimiento facial:
Empresa
Aplicacin
Visaje Technology
http://www.l1id.com/pages/18
FaceKey Corp.
http://www.facekey.com/
Reconocimiento facial. Identificacin de

individuos en checkpoints: reconocimiento
de personas buscadas, entre otros objetivos.
Reconocimiento facial para control de
acceso
Cognitec Systems
http://www.cognitecsystems.de/
Reconocimiento facial en video, control de

frontera, identificacin de sospechosos
personas perdidas, control de acceso.
Passfaces from ID-arts

http://www.id-arts.com/
Control de acceso complementario al

existente o para su reemplazo.
ImageWare Sofware
http://www.iwsinc.com/
Control de acceso mediante una

combinacin
de
varios
mtodos
biomtricos entre ellos reconocimiento
facial
BioID sensor fusion
Reconocimiento biomtrico mediante cara,
http://www.bioid.com/
iris, voz o combinacin de las tres para
accesos web o dispositivos mviles.
Biometric Systems, Inc.
Dispone de un modulo de reconocimiento
http://www.biometrica.com/
facial para inspeccionar similitud con
sospechosos.
SpotIt for face composite
Permite buscar similitudes entre caras,
http://spotit.fbk.eu/SpotIt.html crear identikit en base a las caras, entre
otras opciones.
FaceSDK
La empresa de biometra Luxand tiene
disponible un SDK de reconocimiento
facial. El cual ser utilizado en este trabajo.
Tabla 2.3.3.1 - empresas que ofrecen aplicaciones de reconocimiento facial
2.3.4 Casos de implementaciones de sistemas de reconocimiento facial

A continuacin se enumeran algunas de las aplicaciones de reconocimiento facial
utilizadas en el mundo [Facial Recognition - Wikipedia, the free encyclopedia,
2008], pero hay que tener en cuenta que luego de lo sucedido en las torres gemelas,
mucha de las aplicaciones no son dadas a conocer debido a su carcter de uso secreto.
19
En el distrito de Newham en Londres, se ha utilizado un sistema de

reconocimiento facial en las cmaras de seguridad. Aunque se dice que nunca
ha reconocido ningn sospechoso y el ndice de criminalidad bajo pero ms
por saber que estn las cmaras que porque las mismas realmente funcionaran.
La Polica Federal Alemana aplica un sistema de reconocimiento facial para

voluntarios para pasar controles fronterizos en el aeropuerto internacional de
Frankfurt Rhein-Main.
El sistema de aduana de Australia tambin tiene un sistema de reconocimiento

facial para el control de la frontera llamado SmartGate, que fue implementado
en el ao 2009. El mismo compara el rostro de la persona contra la imagen de
un e-pasaporte (ya que contiene la imagen en un microchip), para verificar que
la persona es la titular del mismo. Solo esta disponible para personas de
nacionalidad australiana.
Figura 2.3.4.1 - Sistema SmartGate.

Figura obtenida de Border crossing
En Pennsylvania la justicia utiliza un sistema de reconocimiento facial en

fotografas e imgenes de circuitos cerrados de televisin obtenidas de escenas
de crimen, con el fin de compararla con su base de datos de sospechosos. Se
informa que varios de los crmenes no resueltos han sido descubiertos desde la
implementacin del mismo.
El departamento de estado de US, opera un sistema de reconocimiento facial

para el otorgado de visas. El mismo es uno de los que mayor informacin
maneja, alrededor de 75 millones de fotografas. Se han realizado aplicaciones
en eventos multitudinarios, como el Super Bowl, para reconocer posibles
criminales y terroristas en el evento.
Utilizacin en cajeros automticos para verificar la identidad de la persona.

Interbank es el primer banco a nivel mundial en evaluar esta tecnologa en la
red de Globalnet.
20
Figura 2.3.4.2 Reconocimiento en una terminal ATM.

Figura obtenida de Seguridad futurista
Reconocimiento facial en recin nacidos implementado en Argentina donde se

otorga un documento de identidad que contendr una imagen del nio. Se
utiliza un sistema desarrollado por expertos argentinos y cubanos.
http://yaerahoraenlaradio.blogspot.com/2012/01/verificacion-facial-pararecien-nacidos.html
Next Generation Identification Programme, es un programa implementado en

USA por el FBI, para instaurar un sistema de reconocimiento facial en las
cmaras de vigilancia de todo el pas, con el fin de identificar personas
prdidas, fugitivos o cualquier otro sujeto de inters.
Las ltimas notebooks Toshiba han incorporado un sistema de reconocimiento

facial para tareas que requieren autenticacin como iniciar la sesin de un
usuario. El mismo se realiza a travs de la cmara integrada que trae el
porttil.
Face Unlock es una aplicacin que permite a los usuarios de mviles con
Android cambiar el desbloqueo del equipo mediante clave por el
reconocimiento de la cara. Previamente el sistema tiene una etapa de
entrenamiento por la cual almacena imgenes de la persona utilizando la
cmara frontal del dispositivo.
21
Figura 2.3.4.3 Imagen del sistema Face Unlock.

Figura obtenida de Android Ice Cream Sandwich review
En Picassa y Facebook existe una funcionalidad capaz de reconocer las caras a

partir de las fotos que suben los usuarios y etiquetarlas, es decir, asociar la
cara con un nombre de usuario.
22
23
3 Captura y armado del modelo 3D

3.1 Captacin de imgenes estereoscpicas Modelo pinhole
Para la captura digital de las caras se ha implementado un mecanismo basado en
visin estreo, con el cual se busca emular la visin humana mediante la utilizacin
del modelo de dos cmaras fotogrficas digitales, con el objetivo de dotar al sistema
de habilidad para realizar medidas sobre el modelo 3D y asegurar cierta precisin.
La principal ventaja de la utilizacin de un sistema de estreo visin es que no
requiere de equipos especiales o sofisticados. Por otro lado, su principal desventaja es
su alto requerimiento de procesamiento computacional para la reconstruccin, que en
ciertos casos puede provocar que no sea aplicable a determinados sistemas, por
ejemplo, que involucren tiempo real de manera crtica.
El modelo de cmara utilizado para la reconstruccin tridimensional, se llama pinhole (o tambin cmara oscura o de agujero), en este modelo todos los rayos pasan a
travs de un centro ptico, situado a una determinada distancia del plano imagen, y
quedan proyectados sobre dicho plano imagen [Fernndez Snchez, 2000]. Las
cmaras pin-hole son el sistema ms simple para captar imgenes y tienen varias
virtudes notables dado que pueden formar una imagen definida y casi sin distorsin de
objetos sobre un campo angular extremadamente ancho y sobre un gran rango de
distancias. Una de sus desventajas debido a la restriccin en el acceso de la luz, es o la
necesidad de iluminacin muy alta o la lentitud de la toma de las imgenes, dado que
sus tiempos de exposicin son extremadamente altos, en rangos de minutos a horas
para la toma de una imagen.
Al realizar el calibrado de las cmaras se necesita tener en cuenta ciertos parmetros
de las mismas, los cuales se pueden separar en dos clases:
-
Parmetros Intrnsecos: son propios de la cmara. Son parmetros de la

geometra interna.
1. Distancia Focal (o distancia principal): distancia entre el plano de la
imagen y la lente de la cmara (agujero de la cmara),
2. Punto Central (o punto principal): las coordenadas del punto principal en
pxeles (centro ptico),
3. Factores de escala: tamao del pxel en milmetros en ambos ejes,
4. Perdida de ortogonalidad: ngulo que forman los dos ejes,
5. Coeficientes de Distorsin; radial, tangencial,
En la matriz de calibracin usada frecuentemente en aplicaciones
estereoscpicas, se consideran y los factores de escala, Uo,Vo las
coordenadas del punto principal y es el parmetro que representa la falta
de ortogonalidad (en algunos contextos se la llama distorsin). La
determinacin de la distorsin se determina en calibraciones previas al uso
de la cmara.
24
Parmetros Extrnsecos: describen relacin espacial entre las cmaras. Son

parmetros de la geometra externa, determinan la posicin de la cmara
respecto a un sistema de coordenadas.
1. Parmetros de Rotacin: la rotacin de la cmara con respecto al sistema
de referencia de la escena
2. Parmetros de Translacin: corrimiento de la cmara con respecto al
sistema de referencia de la escena
3.1.1 Descripcin de la toma de las fotografas

Se han realizado tomas de fotografas de un conjunto de 18 personas, utilizando un
par de imgenes para incluir en la galera de conocidos y otro par de imgenes para
simular el posterior reconocimiento.
Con el fin de no agregar complejidad a la generacin de los modelos tridimensionales
de los rostros, se decidi disponer de una escena esttica, es decir, no se encuentran en
movimientos las personas al momento de realizarse la toma de fotografa, y las
cmaras se configuraron con ejes pticos paralelos normales a la base (segmento que
une ambos puntos principales y lneas de pxeles paralelas a la base). De esta manera
no es necesaria una posterior rototraslacin en el momento de localizar los puntos
homlogos y generacin del MNSF. Esto se logra, tambin con dispositivos de dos
cmaras fijas, que se pueden adquirir en el mercado.
La geometra epipolar corresponde a las relaciones geomtricas entre dos sensores
planos. En la figura 3.1.1.1, se representa la geometra del modelo de dos cmaras que
fue utilizado para determinar los puntos homlogos y calcular las coordenadas de los
puntos de inters de la escena, en base a las dos imgenes tomadas.
Figura 3.1.1.1 - Modelo pin-hole de las cmaras
25
Con respecto a la separacin en horizontal de las cmaras, llamada distancia base (ver
figura 3.1.1.2), en el momento de definirla se tuvo en cuenta que afecta a la
determinacin de la profundidad. Segn [Mazo Quintas, 2005] El error de
profundidad es inversamente proporcional a la distancia base, por esta razn, a
mayor distancia base mejor es la estimacin de profundidad dado que el error
disminuye. Sin embargo, el aumentar demasiado esta distancia es contraproducente
dado que ira disminuyendo la zona de visin comn entre ambas cmaras,
dificultando la puesta en correspondencia de puntos homlogos en las imgenes.
Mediante una buena relacin base profundidad se optimiza esta situacin.
Figura 3.1.1.2 - Zona de visin comn vs. Distancia base.

Figura obtenida de [Mazo Quintas, 2005]
Teniendo en cuenta lo anteriormente expuesto, se decidi considerar una distancia de

separacin de 100mm, un poco superior a la distancia promedio de separacin de los
ojos, tambin llamada separacin interpupilar, que es de 65mm, pero suficiente para
asegurar una buena estimacin de la profundidad y ayudar al calibrado, sin prdida de
zonas de visin comn.
Las cmaras fueron conectadas a una computadora, donde se previsualiza la imagen
mediante un software desarrollado especialmente para la experiencia, que superpone
una cruz, a forma de mira, (ver figura 3.1.1.3), de cuatro pxeles cada lnea, centrada
en el medio de la imagen, y que permite calibrar ambas cmaras con el grillado
colocado detrs de las personas, con separaciones en vertical y horizontal cada 10
centmetros. Esto simplifica los clculos de la calibracin por medio de la matriz
fundamental (ver Anexo 10.1 Calibracin de cmaras).
En el eje X (ver figura 3.1.1.3) se busco que las lneas horizontales a utilizar para
centrar fuera la misma en ambas cmaras y en el eje Y se centro con lneas verticales
contiguas separadas 10 centmetros entre si.
26
Y
X
Z
(a)
(b)
Figura 3.1.1.3 - (a) Ejes cartesianos utilizados. (b) Software de calibrado de la
cmara.
3.2 Modelo 3D del sistema facial

Para la obtencin de un modelo 3D a partir de dos imgenes de una misma escena es
necesario realizar un apareo estereoscpico. Esto consiste en la identificacin de
puntos correspondientes, pares de puntos, denominados puntos homlogos como se
indica en [Zelasco et al, 1998], un par de puntos homlogos representan la
proyeccin de un mismo punto de la escena en las imgenes izquierda y derecha.
A partir de la identificacin de estos puntos homlogos y del conocimiento de los
parmetros internos y externos se obtienen sus coordenadas en el espacio
tridimensional y se genera un modelo numrico de la superficie facial (MNSF).
Los puntos a tomar en las imgenes para armar el modelo numrico tridimensional
estn basados en algunos de los puntos frontales utilizados por [Reyes Enciso et al,
2003], donde se tuvo en cuenta el trabajo realizado por L. Farkas, quien en
antropometra craneal, estableci una base de datos de normas antropomtrica
mediante la medicin y comparacin de ms de 100 dimensiones (lineal angular
contornos de superficie) y proporciones en cientos de personas en un periodo de
varios aos. Estas mediciones incluyeron 47 puntos especficos para describir la cara.
Un subconjunto de 20 puntos, indicados en la figura 3.2.1, ubicados en la parte frontal
de la cara, son los que se tendrn en cuenta en este trabajo para la bsqueda de puntos
homlogos.
En el estudio de [Gupta et al, 2007] tambin se basaron en los puntos propuestos por
L. Farkas para tomar distancias eucldeas y geodsicas, llamadas distancias
antropomtricas, a fin de implementar el reconocimiento de rostros. Y hallaron
mediante el anlisis, que en sus algoritmos cuando reemplazaron estas distancias
antropomtricas por distancias entre puntos faciales arbitrarios el desempeo decreci
sustancialmente, concluyendo que al incorporar conocimiento especfico sobre la
estructura de los rostros se mejora la respuesta de los algoritmos de reconocimiento
facial en 3D.
Por lo tanto, es conveniente seleccionar puntos que permitan tomar distancias entre
partes caractersticas de la cara antes que puntos arbitrarios donde las distancias no
tienen un valor significativo.
27
Figura 3.2.1 - Puntos antropomtricos seleccionados
3.2.1 Puesta en correspondencia de puntos homlogos

La puesta en correspondencia de los puntos homlogos, es decir, determinar para cada
punto de la imagen izquierda su correspondiente en la imagen derecha, es uno de los
difciles problemas que se debe afrontar al formar el modelo tridimensional a partir de
las imgenes estereoscpicas.
Debido a la separacin existente entre las cmaras hay diferencias en la ubicacin de
los puntos en cada imagen, a lo que se llama disparidad. En base a [Lecumberry,
2005], estas diferencias relativas en la posicin de cada imagen, llamada
disparidad, tiene una relacin directa con la distancia (o profundidad) a la que se
encuentran los objetos entre si, y al observador.
En el caso de la visin humana, el cerebro es capaz de detectar esa diferencia y
reconstruir la estructura de la escena que ve el observador. Pero en el caso de la visin
computacional, es necesario buscar algn tipo de algoritmia que permita realizar esta
relacin, conocido como estereopsis digital, siendo este un campo extenso y
actualmente en continuo desarrollo en busca de mejoras.
28
En base a lo que se seala en [Zelasco et al, 1998], el problema esencial de la

estereopsis digital es la identificacin automtica de puntos homlogos, tambin
denominado apareo estereoscpico (stereo matching) o problema de la
correspondencia (correspondence problem) de imgenes estereoscpicas. Por esta
razn se ha decidido realizar la correspondencia de puntos homlogos en forma
semiautomtica, asistida mediante un programa desarrollado por [Bize, 2012] en el
marco de su trabajo profesional.
En el programa de puesta en correspondencia se muestran las imgenes izquierda y
derecha para permitir la seleccin de los puntos homlogos. Esta seleccin puede
efectuarse en forma totalmente manual o en forma semiautomtica mediante el uso de
la biblioteca FaceSDK de Luxand, la cual es un software propietario.
En este trabajo se utiliz la forma semiautomtica donde se detectan los puntos
caractersticos necesarios en cada imagen y luego de forma manual pueden corregirse
sus ubicaciones, en caso de ser necesario, antes de obtener las coordenadas
tridimensionales. En la figura 3.2.1.1 se muestran las imgenes izquierda y derecha
con los puntos homlogos identificados en ambas.
Figura 3.2.1.1 - Imagen del programa de puesta en correspondencia
Cada punto caracterstico que se detecte se registra con un nmero de marca

correspondiente (ver figura 3.2.1) y se le calculan las coordenadas tridimensionales en
base a las coordenadas de posicin del punto en cada imagen bidimensional. Teniendo
en cuenta adems los datos de configuracin de las cmaras como son distancia base,
distancia focal y dpi, etc. que deben ser previamente configurados en el programa.
Luego en una base de datos se guarda la informacin de cada persona que consiste en
el nombre de cada individuo, junto con una referencia a la fotografa utilizada para
realizar los clculos, y las coordenadas tridimensionales de los puntos marcados.
29
En el anexo 10.2 se describe la geometra para realizar el clculo de coordenadas en

base a la configuracin normal de las cmaras que fue utilizada.
Tambin en el anexo 10.3 se describe en detalle la geometra sobre la configuracin
general de las cmaras teniendo en cuenta rotacin y traslacin de una respecto a otra.
3.2.2 Triangulacin de Delaunay

Obtenido el modelo numrico de la cara como una nube de puntos tridimensionales,
se buscara conseguir un modelo digital de la cara o MNSF, mediante una
triangulacin de ese conjunto de coordenadas tridimensionales.
El modelo digital de la cara (MDC) haciendo un paralelo con un modelo digital
topogrfico, como se define en [Priego de los Santos et al, 2006], es una
representacin numrica de las caractersticas del rostro a partir de las coordenadas
tridimensionales de los puntos que lo definen. Y con el MDC se logra aproximar una
superficie real y continua a una superficie matemtica discreta formada por
superficies elementales planas triangulares.
La triangulacin consiste en subdividir un rea en una red de tringulos. Dado un
conjunto de puntos tridimensionales hay muchsimas triangulaciones viables, siendo
la ms optima aquella en la que se consigan los tringulos ms equilteros posibles.
En el caso de la triangulacin de Delaunay deben cumplir una condicin: que la
circunferencia circunscripta de cada triangulo de la red no debe contener ningn
vrtice de otro tringulo. Ver anexo 10.3 donde se detallan las propiedades de la
triangulacin de Delaunay 2D.
En el marco de esta tesis, para realizar la triangulacin de Delaunay se utiliz la
biblioteca open source de CGAL . Con la misma se construye una triangulacin de
Delaunay bidimensional en base a un conjunto de puntos tridimensionales que son
proyectados al plano X-Y con Z = 0. Y se obtiene una malla de tringulos,
conformado por vrtices y celdas que estn conectadas entre si.
Cada celda resultante de la triangulacin tiene la topologa de un triangulo y tiene tres
vrtices, que son formados por los puntos ingresados para realizar la triangulacin;
bordes, formado por la lnea de unin entre dos vrtices de la celda; caras, formado
por tres vrtices conformando cada plano del triangulo (ver figura 3.2.2.1).
Esta informacin es guardada en una tabla de la base de datos, dado que conforma el
MNSF que se utilizar posteriormente para tomar las mediciones intrnsecas de
distancias y curvaturas utilizadas para el proceso de reconocimiento facial.
30
Figura 3.2.2.1 - Celdas obtenidas con Triangulacin 2D de Delaunay con CGAL
En la figura 3.2.2.2 se muestran dos vistas de frente y perfil de la triangulacin

bidimensional de Delaunay obtenidas de un rostro. Esta triangulacin representa el
MNSF a utilizar como superficie de trabajo, en la figura 3.2.2.3 se observa la misma
triangulacin obtenida superpuesta sobre el rostro indicando como quedara el modelo
digital resultante de la cara, sobre el que se trabajar.
Figura 3.2.2.2 - Imgenes obtenidas de la triangulacin Delaunay 2D de una cara
31
Figura 3.2.2.3 - Triangulacin Delaunay 2D superpuesta sobre rostro
32
33
4 Soluciones propuestas para el reconocimiento facial

Obteniendo el MNSF mediante la triangulacin de las coordenadas tridimensionales
del rostro, se aplicarn un par de algoritmos sobre el mismo a fin de obtener
informacin intrnseca representativa que permita posteriormente su comparacin con
otros MNSF.
En este trabajo, se han implementado dos mtodos de reconocimiento. Uno de ellos
consiste en la medicin de las distancias geodsicas, que representan las distancias
ms cortas entre dos puntos en una superficie.
Se ha vuelto a imitar el inicio del reconocimiento facial como en los proyectos de
Bledsoe (1964) o el estudio de [Kanade, 1973] donde se median distancias eucldeas
entre puntos caractersticos de la cara como ser nariz, borde de los ojos y mentn para
luego efectuar las comparaciones. Con la diferencia que al trabajar sobre superficies
podemos medir distancias geodsicas entre los puntos caractersticos del rostro. Lo
cual brinda ventaja en uno de los problemas que enfrenta el reconocimiento facial,
como es lidiar con expresiones faciales, dado que es un mtodo ms robusto que la
medicin de distancias eucldeas, lo que puede afirmarse basndose en el anlisis de
[Gupta et al, 2007] en donde se realizan mediciones entre puntos caractersticos de la
cara con distancias eucldeas y geodsicas llegando a la conclusin que ambos
algoritmos tienen un buen desempeo en su aplicacin pero son justamente las
distancias geodsicas las que tienen mejores resultados al momento de tener en cuenta
las expresiones faciales. Aunque en el presente trabajo no sea sumamente relevante
dado que se utilizan caras neutras, es una ventaja a tener en cuenta para futuras
investigaciones.
El otro mtodo implementado en el marco de esta tesis, se basa en las mediciones de
curvaturas de superficie como ser las curvaturas gaussianas, cuya ventaja especfica
consiste en que se trata de un invariante de superficie y por lo tanto, independiente del
referencial. La curvatura de Gauss se obtiene en determinados puntos especficos
del rostro a partir de las curvaturas principales que son calculadas mediante un
paraboloide osculador tangente a la superficie facial en estos puntos. Esta forma de
proceder permite comparar caras que estn en posiciones arbitrarias en el espacio
respecto del referencial. Para el clculo de las curvaturas principales en una
superficie discreta se presenta un algoritmo que se desarroll e implement dentro del
marco de este trabajo basado en un desarrollo terico de [Zelasco et al, (B)] (ver
anexo 9.5 Desarrollo de la obtencin de las curvaturas de superficie).
4.1 Distancias geodsicas

De acuerdo con [Berreti et al, 2007], el uso de distancias para capturar informacin
facial es directamente motivado por la relevancia que la metrologa tiene en la
antropometra facial, la ciencia biolgica dedicada a medir el rostro humano. Este
campo ha sido altamente influenciado por el trabajo realizado por L. Farkas en 1994,
llamado Anthropometry of the Head and Face, donde se proponen un total de 47
puntos en la cara, con un total de 132 mediciones (comprendiendo distancias
eucldeas, geodsicas y angulares) en la cara y la cabeza.
34
Adems como se seala en [Gupta et al, 2007], estudios recientes de la comunidad

cientfica cognitiva se centraron en la observacin del movimiento de los ojos
durante la tarea de aprender y reconocer caras humanas. Y los autores sugirieron que
el movimiento de los ojos era utilizado tanto para obtener detalles acerca de
caractersticas especiales de la cara como tambin para juzgar distancia entre ellas. Lo
que terminara refutando la idea previa que se tena, sobre que el reconocimiento
facial es solo un proceso holstico basado en informacin relacionada entre partes de
la cara. Es decir, se cree que los ojos tambin realizan mediciones de distancias al
momento del reconocimiento facial.
Las distancias geodsicas son utilizadas en varias aplicaciones grficas, como por
ejemplo, interpolacin radial sobre una malla, propagacin sobre una superficie,
calculo de itinerarios de rutas mediante mediciones de distancias, entre otras. En el
caso del reconocimiento facial la motivacin de aplicar distancias geodsicas tienen
como justificativos, segn [Gupta et al, 2007], que un gran nmero de proporciones
antropomtricas faciales que son utilizadas para caracterizar la forma de las caras
humanas (como en el arte, cosmtica facial, etc.) estn basadas en las distancias sobre
la superficie facial y, adems, estudios recientes en este campo sugieren que es
posible modelar cambios en expresiones faciales como deformaciones isomtricas de
la superficie facial.
Definicin de distancia geodsica
Se puede definir la distancia geodsica de la siguiente manera [Mpiperis et al, 2006]:
Sea S una superficie y P1 y P2 dos puntos cualesquiera en S, hay una cantidad
infinita de curvas pertenecientes a S que conectan P1 y P2 . La curva con la menor
longitud entre dos puntos es llamada camino geodsico (geodesic path) y su longitud
es la distancia geodsica (geodesic distance).
La distancia geodsica cumple los axiomas de cualquier mtrica:
- d( P1 , P2 ) = d( P2 , P1 )
- d( P1 , P2 ) = 0 P1 = P2
- d(P1,P3) d ( P1 , P2 ) + d(P2,P3)
En general, la distancia geodsica es la longitud de una curva que corresponde al
camino ms corto entre dos puntos recorrido sobre una superficie que contiene ambos
puntos. En el caso del presente trabajo, al querer calcular las distancias geodsicas
sobre una malla triangular, esta curva es conformada por una secuencia de lneas
rectas a travs de las caras de los tringulos, por lo cual es tambin llamada geodsica
discreta como se seala en [Martnez et al, 2004]. De esta manera se obtiene un
camino geodsico, el cual puede utilizarse para establecer una mtrica de distancia
para superficies. En la figura 4.1.1 se grafica la diferencia entre la distancia geodsica
(curva) y la distancia eucldea (recta) entre dos puntos de la cara.
35
Figura 4.1.1 distancia geodsica (azul) vs. distancia euclidea (rojo) obtenida de
[Karima Ouji et al, 2008]
Para el clculo de las distancias geodsicas en un mallado triangular se tienen varios

algoritmos disponibles, en un estudio realizado por [Surazhsky et al, 2005] se trabaj
sobre dos algoritmos para el calculo de caminos cortos geodsicos ( shortest geodesia
paths) en una malla triangular, con el fin de explorar el problema de generar una
solucin exacta y otra aproximada pero de menor orden de procesamiento. Tambin
hay otros dos algoritmos importantes que son utilizados para resolver la distancia
geodsica: Fast Marching on Triangulates Domain (FMTD) y Fast Sleeping (FS).
Ambos algoritmos comienzan desde un punto de referencia e iterativamente
aproximan a la solucin exacta con el mismo orden de exactitud. En el caso de
FMTD, este es aplicado en estructuras 3D de malla triangular de la superficie
mientras que FS es aplicado a grillas rectangulares 2D. [Mpiperis et al, 2006].
Se ha decidido utilizar el algoritmo que busca la solucin exacta, llamado Algoritmo
Exacto (Exact Algoritm), que es una implementacin del algoritmo geodsico exacto
realizado por Mitchell, Mount y Papadimitriou en 1987 (conocido como MMP), con
el cual se obtiene la solucin exacta al problema Un origen, Todos los Destinos
(Single Source, All Destinations) en una malla triangular. Este algoritmo fue
implementado en el marco del desarrollo de [Surazhsky et al, 2005]. Con respecto a
su performance se puede decir que de manera pesimista corre en un tiempo de O(m2
logm) siendo m el numero de bordes de la malla, pero queda demostrado con su
aplicacin que el tiempo es mucho menor en los casos prcticos medidos. El cuello de
botella del Algoritmo Exacto es el espacio de memoria disponible para manejar la
cantidad de ventanas que se crean, las cuales aumentan con la cantidad de vrtices de
la malla. En el presente trabajo, al utilizarse tan solo 20 vrtices, para representar la
superficie, no se considera esta limitacin, porque el algoritmo se ha probado
exitosamente en mallas con ms de mil nodos.
Con respecto al funcionamiento, dados una superficie S definida por una malla
triangular y un vrtice vs S el algoritmo MMP computa una representacin explicita
de la funcin distancia geodsica D: S R . Para cada punto p S, esta funcin D(p)
retorna la longitud del camino geodsico desde p al origen vs. [Surazhsky et al, 2005]
36
Estos caminos geodsicos son los ms cortos y estn gobernados por tres propiedades:
Interior a un triangulo,
Un camino corto debe ser una lnea recta, cuando se cruza un borde,
Un camino corto debe corresponder a una lnea recta si las dos caras
adyacentes son no plegadas en un plano comn.
Para realizar el clculo computacional de la distancia geodsica, cada borde de la
malla se divide en un conjunto de intervalos llamados ventanas (windows). Las
ventanas son luego propagadas a travs de la malla mediante el algoritmo de Dijsktra.
Figura 4.1.2 Muestra de las ventanas y calculo de las distancias en el mallado.

Figura obtenida de [Surazhsky et al, 2005]
(c)
Al querer calcular la distancia desde un vrtice origen s a un punto p en el borde de un

triangulo, se puede formar una ventana con todos los caminos cortos desde ese vrtice
a todos los vecinos de p, que pasan por las mismas caras de tringulos, como se
muestra en la figura 4.1.2 (a). Esta distancia se codifica en una tupla ( b0 , b1 , d 0 , d1 ,
, ) que como se observa en la figura 4.1.2 (b) representan b0 y b1 los puntos
terminales de la ventana, una medicin de la distancia a lo largo del borde; d 0 y d1
posicionan el vrtice s en base a las distancias a los puntos terminales de la ventana;
indica la direccin del lado del borde donde cae el vrtice origen s.
Como se puede observar en la figura 4.1.2 (c), si se quiere calcular la distancia desde
el vrtice origen vs a un punto en un borde, y en el medio se puede encontrar un seudo
vrtice origen como s, la distancia total estar dada por la distancia desde vs a s,
indicada por , y la distancia desde el seudo vrtice origen s al punto del borde.
En este trabajo se han realizado dos tipos de mediciones de las distancias geodsicas,
con el Algoritmo Exacto, a fin de comparar entre los mismos y probar si es
justificable aumentar la informacin disponible para poder identificar a una persona
determinada.
Un origen, todos los destinos (GeoOne): En este caso se toma el vrtice

correspondiente a la punta interna del ojo derecho, que es fcilmente
distinguible en todas las personas, y se calculan las distancias geodsicas a
todo el resto de los vrtices del modelo. (Figura 4.1.3)
37
Figura 4.1.3 distancia geodsica del modelo un origen, todos destinos
Todos Origen, Todos Destinos (GeoAll): En este caso se toman todos los
vrtices del modelo de a uno por vez y se calculan las distancias geodsicas a
todo el resto. (Figura 4.1.4)
Figura 4.1.4 distancia geodsica del modelo todos origen, todos destinos
En ambos mtodos los caminos geodsicos, que son una sucesin de lneas rectas
sobre los tringulos de la malla facial desde un punto a otro, se guardan como
informacin junto con el valor de la medicin total de distancia.
38
Estas distancias entre todos los puntos de la cara se utilizaran luego para comparar y
verificar si se reconoce o no a la persona que desea ingresar en el punto de control de
acceso.
4.2 Curvaturas de superficies

Las curvaturas gaussianas son medidas invariantes de cada punto de las superficies, es
decir, se mantienen independientes al referencial que se utiliza al momento de tomar
las imgenes, permitiendo comparar caras que se encuentran en posiciones arbitrarias
en el espacio respecto del referencial.
La curvaturas principales en un punto p de una superficie continua y derivable son
las que corresponden a los radios mximo y mnimo de los crculos osculadores de las
curvas definidas por la interseccin de los planos que contienen al vector normal N a
la superficie en p. La interseccin de los planos 1 y 2 con determinan las curvas
planas 1 y 2 cuyos radios de curvatura en el punto p son el mnimo y el mximo de
todos los posibles definidos en forma anloga por los planos que contienen N. ( ver
figura 4.2.1 ) [Garcia Rio, 2003].
Figura 4.2.1 curva interseccin de un plano normal con la superficie.

Figura obtenida de [Garcia Rio, 2003]
La curvatura de Gauss se obtiene como el producto de las curvaturas principales, que

es una invariante intrnseca.
Para la obtencin de las curvaturas principales a partir de un modelo numrico de
superficie en forma prctica se utiliza el mtodo que se presenta en el anexo 10.4)
[Arellano], donde se calculan curvaturas a partir de un conjunto de puntos que definen
a una superficie.
La implementacin consiste en tomar un punto P00=[Xio jo, Yio jo , Zio jo] , vrtice de
la superficie y sus vecinos prximos, obtenindolos mediante un pequeo incremento
segn se muestra en la ecu. 4.2.1 .
Se ha de tener en cuenta que la curvatura de Gauss solo se evala en ciertos puntos
especficos del rostro, evitando los puntos del contorno de la superficie porque sobre
ellos no se puede obtener la segunda derivada, dado que los vecinos prximos caeran
fuera de la superficie facial. Los puntos que fueron utilizados son 1,2, 3, 6, 9,12 y 17
segn figura 3.2.1.
[Xio-1 jo-1, Yio-1 jo-1, Zio-1 jo-1] [Xio-1 jo, Yio-1 jo , Zio-1 jo] [Xio-1 jo+1, Yio-1 jo+1, Zio-1 jo+1]
39
[Xio jo-1 , Yio jo-1 , Zio jo-1 ] [Xio jo, Yio jo , Zio jo ] [Xio jo+1, Yio jo+1, Zio jo+1 ]
[Xio+1 jo-1, Yio+1 jo-1, Zio+1 jo-1] [Xio+1 jo,Yio+1 jo , Zio+1 jo ] [Xio+1 jo+1,Yio+1 jo+1, Zio+1 jo+1]
[ecu. 4.2.1]
[Xio jo, Yio jo , Zio jo ] es el vrtice del modelo de la cara y los vecinos se determinan
tomando los 8 puntos alrededor al realizar la proyeccin de la superficie en el plano
X-Y sobre un grillado de 1mm (ver figura 4.2.2). Luego se obtiene la coordenada Z
al volver a proyectar en el plano tridimensional.
X (i, j ) = i
[ecu. 4.2.2]
Y (i, j ) = j
[ecu. 4.2.3]
Z (i, j ) = f (i, j ) [ecu. 4.2.4]
Figura 4.2.2 Grillado de la superficie con el punto P00 marcado en el centro y sus vecinos
Para obtener el valor de Z, es necesario identificar en que triangulo del modelo 3D cae
el punto. Por lo tanto se debe verificar si el punto es interno a un triangulo dado,
teniendo en consideracin siguiente definicin.
Consideremos un triangulo ABC y un punto P del plano. P est en el interior de este
tringulo si la orientacin de los tringulos ABP, BCP y CAP es la misma que
la orientacin del tringulo ABC.
A
C
Figura 4.2.3 punto p interior a un triangulo
40
En base a la figura 4.2.3, si tomamos el tringulo ABC, su orientacin esta

determinada por el signo del producto vectorial de AC BC , entonces para
identificar si el punto P es interior se debe verificar que el signo del producto
vectorial de los tres tringulos, ABP, BCP y CAP, que quedan conformados
sean iguales.
Con los tres puntos no colineales, que conforman los vrtices del triangulo, se calcula
la ecuacin cartesiana del plano y se despeja el valor de Z en base a X e Y, que tienen
el mismo valor que en la proyeccin en X-Y.
Dado P=(p1,p2,p3) , Q=(q1,q2,q3) y R=(r1,r2,r3) son no colineales si
p1 p 2 p 3
q q q 0 [ecu. 4.2.5]
1 2 3
r1r2 r3
La ecuacin de un plano esta dada por
[( x, y, z ) P ].(QPx RP) = 0 [ecu. 4.2.6]

Siendo N = (QPx RP ) = ( a, b, c) [ecu. 4.2.7] un vector normal al plano buscado.
Desarrollando la formula y reemplazando con el vector normal se obtiene:
ax + by + cz = N .P [ecu. 4.2.8]
Al conocer x e y se puede despejar z con la siguiente expresin

z=
N .P ax by
[ecu. 4.2.9]
c
Luego en base a estos valores se busca una funcin paramtrica de la superficie que
pase por los nueve puntos
S (u, v) = [ Px(u, v), Py (u, v), Pz (u, v)] [ecu. 4.2.10]
Siendo Px(u,v) , Py(u,v) , Pz(u,v) los polinomios de menor grado.
Luego se obtienen las derivadas de las funciones mediante las siguientes ecuaciones:
S
1
1
Pi 0, j 01 + Pi 0, jo +1
(i0 , j 0 ) =
u
2
2
S
1
1
(i0 , j 0 ) = Pi 01, jo + Pi 0+1, j 0
v
2
2
[ecu. 4.2.11]
[ecu. 4.2.12]
41
2S
(i0 , j0 ) = Pi 0, j 01 2Pi 0, j 0 + Pio, jo +1 [ecu. 4.2.13]
u 2
2S
(i0 , j0 ) = Pi 01, jo 2 Pio, jo + Pi 0+1, jo
v 2
[ecu. 4.2.14]
Si las derivadas parciales son continuas se supone que las cruzadas son iguales y se
pueden obtener con la siguiente formula
2S
1
1
1
1
(i0 , j 0 ) = Pi 01, jo 1 Pi 01, j 0+1 Pi 0+1, j 01 + Pi 0+1, j 0+1 [ecu. 4.2.15]
uv
4
4
4
4
Con estos valores se calculan las curvaturas principales de la superficie buscando las
races de la ecuacin cuadrtica del paraboloide osculador con origen en el punto p.
( D.D' ' D' 2 ).R 2 ( E.D ' '2.F .D '+G.D).R + ( E.G F 2 ) = 0 [ecu. 4.2.16]
Expresin cannica que permite encontrar las races R1 y R2 de la ecuacin
2 z = R1.x 2 + R2 . y 2
[ecu. 4.2.17]
Curvatura Media se obtiene:

Kmed =
1 1
1
+
[ecu. 4.2.18]
2 R1 R2
Curvatura de Gauss se obtiene:

KGauss =
1
R1.R2
[ecu. 4.2.19]
De esta forma se obtiene en cada uno de los puntos seleccionados la curvatura de

gauss, generando un conjunto de curvaturas por cada individuo de la base que se
utilizarn para comparar y reconocer las superficies faciales.
42
43
5 Algoritmos de comparacin de modelos faciales

Los algoritmos de comparacin son los mtodos que se implementaran sobre las
caractersticas obtenidas de cada MNSF a fin de poder reconocer estadsticamente a
una persona.
El anlisis discriminante lineal es una tcnica estadstica que permite separar en
grupos a los objetos en base a sus caractersticas, que en este trabajo seran las
distancias geodsicas y las curvaturas de Gauss medidas en los puntos indicados.
Otra tcnica estadstica que fue utilizada es el error cuadrtico medio, que se basa en
el principio ms simple de buscar el objeto ms cercano en base a minimizar el error
entre las caractersticas de los mismos.
En el contexto del reconocimiento facial, como se indica en [Bronstein et al, 2005],
hay dos posibles escenarios conocidos como:
- Autenticacin: el individuo indica de alguna forma su identidad y ser el
sistema encargado de verificar con la informacin guardada en la galera de
conocidos si efectivamente se reconoce a la persona. Se asume que el sujeto es
colaborativo al momento de intentar ser reconocido. Se conoce a este tipo de
problema como One-to-one matching, donde se compara contra un template
de la base a la persona que se quiere identificar.
-
Reconocimiento: el individuo debe reconocerse entre alguno de los individuos

de la base, pudiendo darse la situacin que la persona no este en la base. En
este caso se considera que el sujeto no es colaborativo, ya sea porque no lo
desea o porque se realiza el proceso sin su conocimiento, por ejemplo, en
imgenes obtenidas por una cmara de vigilancia en un aeropuerto. Se le llama
One-to-many matching, cuando una persona a identificar debe compararse
contra el template de todos los individuos en la base. Actualmente este
problema con la tecnologa actual, segn [Bronstein et al, 2005], es
prcticamente irresoluble, en realidad, si se quiere trabajar con una exactitud
del 100%, pues no hay un sistema que pueda identificar a cualquier persona de
este mundo mediante la obtencin de un modelo facial.
En el presente trabajo se busca realizar la autenticacin de las personas que desean

obtener acceso a un lugar restringido, por lo tanto se presupone que el sujeto ser
colaborativo con el sistema y adems se utilizara algn medio que permita indicar
contra que sujeto de la galera de conocidos se debe identificar a la persona, para tener
dicha informacin disponible en la aplicacin de los mtodos de comparacin.
5.1 LDA: Anlisis Discriminante Lineal

El anlisis discriminante lineal, segn [Teknomo, 2006], es una tcnica estadstica
para clasificar objetos en grupos basndose en un conjunto de caractersticas
mensurables del objeto. Los grupos son previamente conocidos y no tienen un orden.
44
En el anlisis discriminante existen dos tipos de variables, las dependientes (Y) que
representan el grupo y las variables independientes (X) que representan las
caractersticas que describen a los grupos.
El LDA solo es aplicable si los grupos son linealmente separables, es decir, que
puedan ser separados por una combinacin lineal de las caractersticas que describen a
los objetos.
Lo que se va a buscar es la probabilidad de que un objeto pertenezca a un determinado
grupo, lo cual se puede expresar P(i|x) > P(j|x) j i , siendo P(i|x) la probabilidad
de que el objeto pertenezca al grupo i dado el conjunto x, lo mismo para P(j|x) pero
con el grupo j.
En la prctica, es ms sencillo obtener P(x|i) que representa la probabilidad de tener
cierto conjunto de caractersticas sabiendo que el objeto pertenece a la clase i.
Haciendo uso del teorema de Bayes podemos obtener la probabilidad buscada segn
la formula
P(i | x) =
P (i ) P( x | i)
[ecu. 5.1.1]
P( x | j ) P( j )
j
Siendo P(i ) y P( j ) la probabilidad de pertenecer a sus respectivos grupos i o j, que

puede ser la misma a priori o variarse como umbral del mtodo LDA.
Sin embargo, el uso directo de esta regla de Bayes no es posible por la cantidad de
datos necesarios para obtener la frecuencia relativa de cada grupo y cada caracterstica
y poder calcular P(x|i). Por eso, se presupone una distribucin normal y se aplica la
formula siguiente del anlisis lineal discriminante.
f i = i C 1 x kT
1
i C 1 iT + ln( pi ) [ecu. 5.1.2]
2
xk , son las mediciones de cada caracterstica de cada individuo

i, son los posibles grupos en nuestro caso serian solo dos: Reconocido No
Reconocido
i , la media de cada una de las caractersticas de cada grupo
pi , la probabilidad del grupo, que puede en un principio tomarse igual para todos los
grupos. O puede tomarse un valor arbitrario, ya que funciona como un umbral al
aplicarse el mtodo.
1 g
ni ci [ecu. 5.1.3] Es una matriz de agrupacin entre matrices de covarianza
n i =1
por grupo que se calculan segn la siguiente formula
C=
( xi ) t xi
[ecu. 5.1.4] matriz de covarianza del grupo i siendo xi = xi [ecu.
ci =
ni
5.5] con media global de cada una de las caractersticas
45
La formula [ecu. 5.1.2] se aplica por cada sujeto x k al querer reconocerlo y para todos
los grupos posibles obtenindose un f i por cada grupo, con lo cual se termina
asignando cada sujeto al grupo que tenga el valor mayor.
En el caso prctico tenemos nicamente dos grupos para clasificar, en un grupo, que
se llamara Reconocido, se encuentra el modelo del rostro a identificar que existe
previamente en la base y en otro grupo, llamado No Reconocido, todos los restantes
modelos de caras que conforman la base. Las caractersticas segn el caso sern las
mediciones de distancias geodsicas o de curvaturas gaussianas que se tomaron sobre
los MNSF.
Primeramente los MNSF se representan en una matriz M, con tantas filas como
individuos se encuentren en la base y tantas columnas como caractersticas se utilicen
para comparar como se muestra en la figura 5.1.1. Esta matriz se arma de forma de
juntar el grupo No Reconocido en la parte superior, que seran los rostros de los
individuos de la base que no son a quin quiero reconocer y el otro grupo,
Reconocido, en la parte inferior, conformado por el rostro en la base del individuo que
quiero reconocer, por lo tanto sera solo una fila dado que se ha tomado un solo
modelo en la base por cada individuo. Es posible tomar varios modelos de base por
cada individuo, sobre todo en los casos que se quieran tener en cuenta distintas
expresiones faciales a fin de mejorar el reconocimiento.
M=
Figura 5.1.1 Matriz conformada en las filas por los individuos de la base y en las columnas por la
medicin de las caractersticas. Hay dos grupos: la superior conformada por los MNSF de los
individuos de la base que no son la persona a reconocer, la inferior conformada por el MNSF que existe
en la base del individuo a identificar
Luego se calcula la media total de cada caracterstica (figura 5.1.2), por lo tanto ser
la media total por columnas de la matriz, y tambin se calculan la media de cada
grupo 1 y 2 , es decir por columna pero solo teniendo en cuenta las pertenecientes al
mismo grupo.
1
M=
Figura 5.1.2 Calculo de la media global y de cada grupo por separado
46
Restamos a la matriz la media total, M y la dividimos en dos teniendo en cuenta

los grupos, con lo cual nos queda M 1 y M 2 como vemos en la figura 5.1.3
M1
M=
-
M2
Figura 5.1.3 Matrices de cada grupo luego de restar la media global.
Obtenemos las matrices de covarianza de cada grupo como

M 1t xM 1
C1 =
[ecu. 5.1.6]
nro. filasM 1
C2 =
M 2t xM 2
[ecu. 5.1.7]
nro. filasM 2
Y calculamos la matriz de agrupacin de matrices de covarianza segn [ecu. 5.1.3]

con la siguiente ecuacin
C=
nro. filasM 1 xC1 + nro. filasM 2 xC2

nro. filasTotal
[ecu. 5.1.8]
Con la inversa C 1 , 1 y 2 aplicamos la [ecu. 5.1.2] siendo los xk los valores de las
caractersticas del individuo a identificar, es decir los valores que se calculan en el
momento del reconocimiento.
Para cada MNSF del rostro a identificar obtenemos como resultados un valor f1 y un
f 2 representando los grupos No Reconocido y Reconocido respectivamente.
f1 : indica que pertenece al grupo No Reconocido conformado por los modelos de
rostros de la base que no son de la persona que quiero identificar
f 2 : indica que pertenece al grupo Reconocido conformado por el modelo del rostro
que esta en la base y pertenece a la persona que quiero identificar.
Si f1 <= f 2 concluimos que ese modelo de la base podra ser la persona que quiero
identificar, en caso contrario no es la persona. En la figura 5.1.4 la lnea de f 2 solo
supera el valor de f1 en el individuo que se toma como reconocido, en este caso el
nmero 1. En el resto de los individuos se mantiene por debajo, en algunos casos
alejndose bastante y en otros ms prximos, indicando que en esos casos las
caractersticas son bastante semejantes en ambas personas pero no lo suficiente para
reconocerla como la misma.
47
Reconocimiento LDA
1050
Valor
1000
950
f1
f2
900
850
800
17
15
13
11
750
Individuo
Figura 5.1.4 reconocimiento por LDA
5.2 Error cuadrtico medio

El error cuadrtico medio es una forma de evaluar la diferencia entre un estimador y
el valor real, con el fin de seleccionar el estimador que cometa el menor error en la
estimacin.
Al tener el modelo 3D de las caras como una nube de puntos, se puede aplicar el
mtodo de error cuadrtico mnimo para comparar los modelos y definir cual esta ms
cercano a otro, aplicando la idea que cometa el menor error en los valores de cada
caracterstica.
Sea T = (t1 , t2 ,.., tn ) el modelo de testeo a quien se quiere identificar y sean tn las
caractersticas sobre las que se realizarn las comparaciones. Sea B = (b1, b2 ,.., bn ) el
modelo de la base y sean bn las mismas caractersticas sobre las que se tomara el
error cuadrtico medio.
Se toman las diferencias al cuadrado por cada caracterstica del sujeto a identificar
contra cada uno de todos los sujetos de la base.
Ei = ( ti bi ) i = 1..n [ecu. 5.2.1]
2
La [ecu. 5.2.1] indica la forma de calcular el error cuadrtico medio de cada

caracterstica. De esta forma de obtiene por cada sujeto de la base un vector de n
valores, sobre estos se calcularn la media [ecu. 5.2.2] y la desviacin Standard [ecu.
5.2.3] de dichas diferencias
1 n
j = Ei [ecu. 5.2.2]
n 1
48
j =
1 n
(Ei j ) [ecu. 5.2.3]
n 1 1
En el caso ideal, que las mediciones fueran exactamente iguales, la media debera dar
cero ya que la diferencia entre el valor medido de cada caracterstica es el mismo, con
lo cual el error cuadrtico medio sera cero en todas las caractersticas.
En la prctica, en general, las mediciones difieren, por lo tanto se presupone que el
sujeto de la base que mejor se aproxima al que quiero reconocer es el que presenta
menor valor de la media general. Sin embargo, es posible que otro sujeto de la base
que no sea el que intento reconocer tenga una media similar o menor al sujeto real,
por eso se utiliz un umbral igual al desvi standard, para permitir una tolerancia en el
reconocimiento de las caras.
Como al realizar la autenticacin se conoce a priori, cual es el modelo de la base
contra el que debe ser identificado, si el mismo es el que tiene el valor menor de
media o esta dentro del radio de tolerancia se lo toma como reconocido sino se
considera que no pudo ser reconocida la cara.
49
6 Verificacin experimental
Se dispone de 30 imgenes de prueba, algunas con su MNSF incluido en la base, o
sea, la galera de conocidos y otras que no forman parte de la misma a fin de efectuar
el reconocimiento y evaluar el desempeo de los algoritmos desarrollados.
Se aplicaron en todos los casos de prueba los tres algoritmos de reconocimiento facial
desarrollados (Curvaturas, GeoOne, GeoAll) y se experimento la variacin del
desempeo de los mismos modificando la probabilidad de pertenecer a cada grupo al
aplicar el algoritmo de LDA y la variacin ante la inclusin o no de un umbral de
tolerancia al implementar el algoritmo de comparacin por cuadrados mnimos.
Los resultados sern analizados mediante la curva ROC (Receiver Operating
Characteristic), una herramienta que permitir comparar y seleccionar el algoritmo
ptimo utilizando los valores de dos caractersticas operativas como son la tasa de
verdaderos positivos (TVP) contra la tasa de los falsos positivos (TFP). Como se
define en Curva ROC Wikipedia, the free encyclopedia. La TVP mide hasta qu
punto una prueba diagnstica es capaz de detectar los casos positivos correctamente,
de entre todos los casos positivos disponibles durante la prueba, y la TFP define
cuntos resultados positivos son incorrectos de entre todos los casos negativos
disponibles durante la prueba. Tambin se evaluar la precisin de cada mtodo para
realizar su comparacin de desempeo, la cual esta definida por la siguiente frmula
Pr ecisin( ACC ) =
VP + VN
[ecu. 6.1]
P+N
VP = Verdaderos positivos
VN = Verdaderos Negativos
P = total casos positivos
N = total casos negativos
Al implementar el algoritmo LDA los grupos disponibles a los cuales puede

pertenecer un individuo de prueba son dos
Grupo 1: No Reconocido, conformada por los modelos de caras del resto de las
personas de la base
Grupo 2: Reconocido, conformada por el modelo de la cara de la persona a reconocer
Se comienzan las pruebas con una probabilidad baja de pertenecer al grupo 2 de 0,05
y de 0,95 de pertenecer al grupo 1. Con respecto a la tabla 6.1, mediante las
mediciones de curvaturas se obtuvo una psima tasa de reconocimiento de verdaderos
positivos (TVP) 6,6%. En base al anlisis de los datos, se pudo observar que la
aplicacin del mtodo LDA no poda separar correctamente los patrones de los
modelos de la base, un requisito principal para poder aplicar satisfactoriamente el
mtodo LDA, por lo tanto, con este umbral de probabilidad para el grupo 2, en
curvaturas no es un mtodo aplicable para separar los grupos.
En cuanto a los mtodos de mediciones de distancias geodsicas, los dos tienen una
tasa del 60% de reconocimiento TVP y la separacin de patrones era correcta en todos
los casos de los modelos de la base. Pero al tener en cuenta la tasa TFP se observa que
50
en el mtodo GeoOne es de 20% contra el 47% de GeoAll, indicando que la precisin

del 70% de GeoOne es mejor que GeoAll con un 57%, pues es menos propenso a
reconocer falsos positivos.
Sin embargo, GeoOne con este porcentaje de precisin de reconocimiento esta en un
nivel bajo para un algoritmo de reconocimiento, que debera al menos superar el 70%
como la mayora de los sistemas disponibles actualmente en el mercado.
Umbral
grupo 2 = 0,05
grupo 2 = 0,5
grupo 2 = 0,9
TVP
TFP
Precisin
TVP
TFP
Precisin
TVP
TFP
Precisin
GeoOne
0,6
0,2
0,7
0,6
0,2
0,7
0,8
0,2
0,8
GeoAll
0,6
0,47
0,57
0,6
0,53
0,53
0,6
0,53
0,53
Curvatura
0,06
0
0,53
0,4
0,13
0,63
0,6
0,13
0,73
Tabla 6.1 comparacin del desempeo de los mtodos en base a la variacin del umbral al utilizar
LDA.
Luego se vario la probabilidad de los grupos a 0,5 para ambos. Como se observa en la
tabla 6.1, se obtuvo que la medicin de curvaturas aumento a un 40% TVP, con lo
cual el mtodo mejoro, su precisin llega al 63% pero an no lo suficiente para ser
confiable. Por otro lado, se verific que el algoritmo LDA pudo realizar
correctamente la separacin de grupos de los modelos de la base.
En cuanto a los otros dos mtodos de aplicacin de distancias geodsicas, an cuando
se vario la probabilidad de los grupos, la precisin de ambos mtodos se mantuvo, lo
mismo su tasa de reconocimiento TVP en 60% y tambin la TFP
Por ltimo, se modifico el valor de la probabilidad del grupo 2 subindola a 0,9 y el
grupo 1 bajndola a 0,1 obteniendo los resultados indicados en la ltima fila de la
tabla 6.1.
En cuanto a los mtodos de distancias geodsicas, GeoAll se mantuvo invariable la
tasa de reconocimiento TVP en un 60% y TFP en un 53%, prcticamente igual que en
los casos previos. Sin embargo, GeoOne mejoro su desempeo al aumentar a 80% la
tasa de reconocimiento TVP siendo el nivel ms alto obtenido entre los algoritmos
desarrollados en este trabajo y mantuvo baja la TFP en 20%. La precisin de 80% de
GeoOne es de las ms altas obtenidas.
En el mtodo de curvaturas se mejoro notablemente el nivel de reconocimiento
llegando a un 60% TVP y con un bajo nivel TFP del 13%. Su precisin supero a
GeoAll llegando a un 73%, convirtindolo en el segundo mejor mtodo en lo que
respecta a este trabajo.
En la figura 6.1 se grafic la variacin de la precisin de cada mtodo en base a la
variacin del umbral, pudiendo observarse que GeoOne llega al valor mayor del 80%
51
cuando el grupo 2 tiene una probabilidad de 0,9, y que su incremento no es tan

significativo ante la variacin del umbral. Por el contrario, esta el mtodo de
curvaturas donde su precisin crece a medida que aumenta la probabilidad del grupo
2, llegando a un valor de precisin del 73%, superior a GeoAll que mantiene
prcticamente invariable la precisin, cercana al 60%, ante los cambios de valores del
umbral.
Comparacin Precisin de los Mtodos con LDA

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
geoone
geoall
grupo2 = 0.05
curvatura
grupo2 = 0.5
grupo2 = 0.9
Figura 6.1 Comparacin de precisin de los mtodos con LDA
TVP
CURVA ROC MEDIANTE LDA

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
TFP
geoone
geoall
curvatura
Figura 6.2 Curva ROC de los tres mtodos segn la variacin del umbral aplicando LDA
Se pueden observar en el grfico de la figura 6.2 las curvas ROC para cada mtodo
ante la variacin del umbral. Con GeoOne vemos que TVP aumenta hasta un 80% en
el mejor caso mientras que TFP se mantiene constante en 20%. Esto indica que el
mtodo es confiable, es decir, podr reconocer satisfactoriamente a las personas y
52
adems evitar los intentos de accesos fraudulentos. Por ser el que tiene el valor ms
cercano al extremo superior izquierdo, donde se encontrara el mtodo ideal, se lo
considera el ms ptimo.
Por el contrario en GeoAll tenemos unos valores de curva muy prximos a la diagonal
en donde se considera que es un mtodo azaroso. Su tasa de reconocimiento de casos
positivos verdaderos es muy prxima a la tasa de reconocimiento de casos falsos
positivos, por lo tanto no es un mtodo til dado que tiene alta probabilidad de no
identificar casos fraudulentos de identidad.
En contraposicin, tenemos al mtodo de curvaturas que va mejorando con el
aumento del umbral, llegando a TVP 60% como GeoAll, pero tiene una TFP
significativamente menor del 13%, grficamente puede observarse como la curva esta
ms alejada de la diagonal y es ascendente. Por esta razn este mtodo llega a una
precisin del 73% superando a GeoAll.
Al aplicar el mtodo de comparacin por error cuadrtico medio en los algoritmos
desarrollados se utiliz el mismo grupo de prueba con el fin de luego poder cotejar los
resultados con los obtenidos mediante la aplicacin de LDA.
La primera corrida de reconocimiento por error cuadrtico medio fue con un umbral
cero, es decir, sin tolerancia. En base a los datos de la tabla 6.2, se concluye que las
probabilidades de reconocimiento de casos positivos verdaderos son demasiado bajas.
El peor desempeo lo tiene curvaturas con TVP 13,3%, seguido por GeoOne con un
TVP 27% y GeoAll, con la tasa de reconocimiento superior de 40%, que no llega a un
valor aceptable.
Umbral
sin umbral
con umbral
TVP
TFP
Precisin
TVP
TFP
Precisin
GeoOne
0,27
0
0,63
0,67
0,27
0,7
GeoAll
0,4
0,13
0,63
0,73
0,4
0,67
Curvatura
0,13
0,07
0,53
0,4
0,33
0,53
Tabla 6.2 comparacin de mtodos con cuadrados mnimos sin umbral de tolerancia
Variando el umbral de modo que sea igual al desvi standart de cada individuo, es
decir, permitiendo que la cara a reconocer se encuentre dentro de un radio prximo
delimitado por el valor del desvi standard de la misma, se observa de la tabla 6.2,
que las probabilidades de reconocimiento TVP aumentan considerablemente.
En el caso de curvatura se llega a un 40%, lo cual mejora sustancialmente el caso
previo pero an no llega a tener un nivel que lo haga un mtodo aceptable, dado que
TFP del 33% es un valor similar. Se observa en la curva ROC de la figura 6.4 como se
aproxima a la diagonal haciendo que sea un mtodo azaroso en sus resultados.
Con GeoOne se obtiene una tasa TVP del 67% mejorando notablemente los 27%
obtenidos al no tener un umbral de aceptacin, su nivel de precisin llega a un 70%
haciendo que sea el mtodo ms confiable al aplicar error cuadrtico medio.
53
El mayor ndice TVP de reconocimiento llega a 73,3% con GeoAll, pero a diferencia
de GeoOne tiene tambin un alto ndice TFP del 40%, por lo cual su precisin es
menor, pues tiene mayor probabilidad de reconocer falsos positivos que en el caso de
GeoOne.
Comparacin Precisin de los Mtodos con Error Cudrtico Medio

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
geoone
geoall
sin umbral
curvatura
con umbral
Figura 6.3 Comparacin de precisin de los mtodos con error cuadrtico medio
TVP
CURVA ROC MEDIANTE ERROR CUADRATICO MEDIO

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
TFP
geoone
geoall
curvatura
Figura 6.4 - Curva ROC de los tres mtodos segn la variacin del umbral aplicando error cuadrtico
medio
En la figura 6.3 se observa como la precisin de todos los mtodos aumenta con la
aplicacin de un umbral en el caso de comparacin con error cuadrtico medio, y
tiene el mayor valor el mtodo GeoOne. Incluso en la curva ROC de la figura 6.4 se
puede ver como la curva de este mtodo se encuentra por encima de las dems y ms
prxima al mtodo ideal. Por otro lado, GeoAll aumenta levemente su precisin pues
54
aunque aumenta su TVP tambin aumenta proporcionalmente TFP, como se observa

en la curva ROC.
Por ltimo en el caso de Curvaturas la precisin no varia se mantiene igual con o sin
umbral, en su curva ROC se muestra como aumenta TVP y TFP en la misma
proporcin y se encuentra prxima a la diagonal, haciendo que sea un mtodo casi
azaroso al momento de realizar el reconocimiento.
55
7 Conclusiones, Limitaciones y Futuras lneas de investigacin

En primer lugar se concluye que la confeccin de los MNSF influye directamente en
la obtencin de los resultados, sin un buen modelo tridimensional no es posible
conseguir un nivel de reconocimiento vlido. Los principales problemas a afrontar
son: la calibracin de las cmaras, resolucin de las imgenes y obtencin de los
puntos homlogos, pues son determinantes al momento de armar un MNSF vlido
sobre el cual realizar las mediciones de las caractersticas que se usarn para comparar
en cada mtodo.
La correcta calibracin de las cmaras es uno de los primeros puntos crticos que
deben controlarse al momento de las tomas de las imgenes estereoscpicas.
Actualmente se esta progresando en la confeccin de cmaras estereoscpicas que
vienen armadas y calibradas de fbrica, pues hoy en da son incorporadas en los
ltimos celulares (como los caso de LG Optimus 3D P920, Diamond S de Samsung) y
consolas de videojuegos (Xbox), dado que se esta avanzando mundialmente en la
utilizacin de imgenes en 3D permitiendo tomar fotografas, filmar o jugar en forma
interactiva con una alta resolucin de imagen.
la ventaja de las imgenes estereoscpicas reside en la posibilidad de tomar muestras
rpidamente a diferencia de utilizar un scanner, que necesita un largo tiempo de
exposicin o como en el caso de luz estructurada donde se necesita una iluminacin
especial. En este caso se puede trabajar con una luz normal suficiente para obtener
unas imgenes ntidas.
En cuanto a la obtencin de los puntos homlogos, se observan avances en este
campo permitiendo reconstrucciones automticas con aceptables niveles de exactitud,
dependiendo de la resolucin de las imgenes y de la calidad de la misma, es decir,
que no tengan demasiadas oclusiones, que sea ntida, para que los algoritmos puedan
hacer una correcta deteccin de los puntos en las imgenes y obtener un buen modelo
3D sobre el cual trabajar. En este trabajo se utiliz la biblioteca FaceSDK con la
cual se obtuvo un alto nivel de reconocimiento de los puntos homlogos en general,
aunque se uso asistencia manual en los casos de deteccin incorrectos de los puntos.
Sobre los mtodos de comparacin implementados en el presente trabajo, LDA y
error cuadrtico medio, se puede concluir, como se detalla en la tabla 7.1, que la
probabilidad de reconocimiento de los algoritmos mejora al aplicar LDA, pues es un
mtodo estadstico ms rico que tiene en cuenta varias variables al momento de hacer
las separaciones de grupos, por lo tanto lo hace un mtodo ms exacto que error
cuadrtico medio. En este ltimo no hay separaciones de grupos, sino bsqueda de la
cara ms cercana en base al error medio basado en las caractersticas obtenidas de los
MNSF.
Probabilidad
LDA grupo2=0,9
Precisin
Error cuadrtico
Precisin
medio
con umbral
GeoOne
80%
70%
GeoAll
53%
67%
Curvatura
73%
53%
Tabla 7.1 Mtodos con mayores tasas de reconocimiento
56
Con los mtodos de reconocimiento del presente trabajo podemos decir que la
medicin y comparacin mediante curvatura de gauss, aplicando la comparacin
mediante error cuadrtico medio tiene un bajo nivel de precisin 53%, observando del
anlisis de la curva ROC que su comportamiento es casi azaroso.
En el caso de aplicar la comparacin mediante LDA se observa que la respuesta es
muy sensible a la variacin de la probabilidad de cada grupo. Incluso no es aplicable
LDA cuando la probabilidad del grupo a reconocer es muy baja, debido a que no
puede realizarse una correcta separacin de grupos entre los modelos de la base.
La curvatura de gauss utilizando como mtodo de comparacin LDA, no llega a un
buen nivel de reconocimiento aceptable en el mercado actual, en el mejor caso
presenta una precisin del 73%, por lo cual su utilidad podra ser orientada a buscar
similitudes en caras pero no para reconocimiento.
Por otro lado, las distancias geodsicas demostraron tener un alto nivel de
reconocimiento, incluso se puede observar que no por agregar ms puntos de la cara
para comparacin se obtienen mejores resultados, dado que GeoAll obtiene menores
niveles de probabilidad que GeoOne, utilizando menos puntos de comparacin.
El mtodo LDA en ambos algoritmos de distancias geodsicas es aplicable, pues an
con los cambios en la probabilidad de grupo, se hace una correcta separacin de los
modelos de la base en todos los casos.La precisin no es tan sensible a la variacin
del umbral de probabilidad de grupo, para GeoAll se mantiene constante casi cercano
al 60% y en el caso de GeoOne se mantiene en 70% y llega a su mximo del 80%
cuando la probabilidad del grupo a reconocer es superior.
El mtodo GeoAll utilizando LDA como mtodo de comparacin tiene una
probabilidad de reconocimiento TVP constante de 60% y una probabilidad TFP de
permitir accesos fraudulentos cercana al 40%, por lo tanto, no es un mtodo confiable,
de su curva ROC puede observarse que se aproxima a un mtodo azaroso.
En cuanto al mtodo GeoOne utilizando comparacin mediante LDA llega al ms alto
nivel de reconocimiento de los algoritmos desarrollados en este trabajo, con una
precisin del 80%, teniendo una alta tasa de reconocer personas verdaderas y una tasa
baja de permitir accesos con identidad fraudulentas. De esta manera se convierte en el
mtodo aconsejado para aplicar en el reconocimiento facial en base al anlisis de este
trabajo.
En el caso de la comparacin de las distancias geodsicas con el mtodo de error
cuadrtico medio tomando un umbral de tolerancia, los niveles varan de forma que
GeoAll alcanza una probabilidad de precisin del 67% y GeoOne disminuye a 70%.
Por lo tanto, la diferencia entre si no es muy distante, de la curva ROC se puede
observar que ambas estn muy prximas y tienen un comportamiento similar ya que
TVP aumenta proporcionalmente con su TFP, siendo GeoOne el que tiene mejores
resultados pues la relacin de incremento es menor.
En el presente trabajo solo se tuvo en cuenta el manejo de rostros con expresin
neutra, una futura mejora sera profundizar en el manejo de expresiones faciales uno
de los puntos difciles de enfrentar para el reconocimiento tridimensional. En el
estudio de [Haar et al, 2008] se propone trabajar con la parte invariante de la cara
57
conformada por el triangulo formado por la punta de la nariz y los dos ojos, lo cual
quita informacin del modelo pero habra que evaluar en cuanto se modifica el
porcentaje de reconocimiento y si ayuda a superar el problema de las expresiones
faciales. De todas formas, en el estudio de [Gupta et al, 2007], se indica que las
distancias geodsicas son un mtodo robusto para las expresiones faciales, as tambin
se seala en [Bronstein et al, 2005] donde ambos aseguran que las deformaciones en
la cara debido a las expresiones faciales pueden ser modeladas como isometras, de tal
manera que las propiedades geomtricas intrnsecas de la superficie facial permanecen
invariantes frente a los cambios debido a las expresiones, salvo en los casos de boca
abierta que generan demasiada variacin en el modelo y por lo cual quedan fuera del
alcance en ambos trabajos.
Basados en la idea de la deformacin isomtrica de la cara, podra extenderse la base
actual de este trabajo incluyendo tomas de los sujetos con expresiones faciales para
verificar si se mantiene o vara la tasa de reconocimiento de los mtodos GeoOne y
GeoAll.
Otro de los puntos importantes a tener en cuenta a futuro es la bsqueda de puntos
homlogos en forma totalmente automtica, dado que es fundamental al momento del
armado del MNSF. En nuestro caso se utilizo un algoritmo automtico con la
posibilidad de acomodar los puntos obtenidos para controlar los casos donde el
apareo no era ptimo, pero se podra profundizar en la forma de hacer uso del
conocimiento de la distribucin de la cara y de la posible ubicacin de los 20 puntos
que se localizan para conformar el MNSF a fin de mejorar el apareo estereoscpico y
que sea totalmente automtico y fiable.
En cuanto al mtodo de comparacin LDA, se podran utilizar varias imgenes de la
persona para conformar el modelo en la base y comprobar como influye en los
resultados de reconocimiento, dado que este mtodo mejora con el aprendizaje. Como
as tambin se podran evaluar los resultados que se obtengan con otros mtodos de
comparacin.
58
59
8 Glosario
Apareo Estereoscpico: consiste en la identificacin de puntos correspondientes en
un par de imgenes estereoscpicas.
Camino geodsico: La curva con la menor longitud al tomar una distancia entre dos
puntos de una superficie
Distancia Geodsica: es la longitud de una curva que representa el camino ms corto
entre dos puntos de una superficie.
Dpi (dot per inch): tambin conocido como pxel por pulgada (ppp) es una medida
utilizada en las mquinas que indica los puntos que entran en una pulgada para
representar una imagen.
Deformaciones isomtricas: una transformacin de una superficie que mantiene las
medidas.
Estereoscopa: es toda tcnica utilizada para generar una imagen tridimensional a
travs de informacin visual del entorno.
Falso positivo: denominado error tipo I en estadstica, dado que es el error que se
comete al identificar como positivo un caso que debera ser negativo.
Geodsica discreta: una distancia geodsica conformada por una secuencia de lneas
rectas en la superficie.
Mtodo biomtrico: mtodos para el reconocimiento nico de humanos basados en
uno o ms rasgos conductuales o rasgos fsicos intrnsecos.
Mtodo invasivo: es un procedimiento donde se aplican tcnicas que invaden el
cuerpo de una persona
Modelo digital de la cara (MDC): es una representacin numrica de las
caractersticas del rostro a partir de las coordenadas tridimensionales de los puntos
que lo definen. Se aproxima una superficie real y continua, como es el rostro, a una
superficie matemtica discreta formada por superficies elementales planas
triangulares
Modelo numrico 3D de superficies faciales (MNSF): es la representacin
numrica del rostro mediante el conjunto de puntos obtenidos al realizar el apareo
estereoscpico.
Puntos homlogos: puntos en las imgenes, correspondientes al mismo punto en el
espacio objeto.
Proporciones antropomtricas: En base a [Gupta et al, 2007] las proporciones
antropomtricas crneo-faciales son promedios de pares de lneas rectas a lo largo de
distancias sobre la superficie entre puntos especficos craneales y faciales. Estas
proporciones faciales cuantifican las relaciones entre diferentes subpartes de las caras
60
humanas, y son ampliamente utilizadas en arte y escultura como guas para crear
rostros ideales bien proporcionados, en antropometra para analizar a los humanos
prehistricos, para cuantificar el atractivo facial, para analizar desproporciones
faciales en anomalas y como una ayuda para planear cosmtica facial y cirugas
reconstructivas. Y, ltimamente, para crear modelos de caras humanas en
computacin grafica, como en el caso de los videojuegos.
Visin binocular: es todo tipo de visin donde se utilizan dos dispositivos para
obtener imgenes del entorno, puede ser una visin simple donde se tienen dos
imgenes por separado o ms compleja con fusin binocular, como los seres
humanos, llamada visin estreo.
Visin Estreo : es la visin realizada a travs de dos dispositivos que enfocan a un
rea comn y permiten la reconstruccin tridimensional de la misma. Por ejemplo, los
ojos de los seres humanos y varios animales funcionan de esta forma.
Verdadero Positivo: en estadstica se le llama a los casos que se identifican como
verdaderos y se comprueban que realmente lo son.
61
9 Anexos
9.1 Calibracin de una cmara digital: mtodo simplificado
Se suponen 2 cmaras digitales, sean C1 : cmara 1 y C2 : cmara 2, colocadas de
manera que ambas enfoquen en paralelo una cuadrcula de 10 cm de lado; el eje
principal, de ambas normal a la cuadrcula y sus ejes principales pasando por puntos
de la cuadrcula separados de 10 cm. La cmara 2 estar 10 cm ms cerca de la
cuadrcula que la cmara 1 (ver figura 9.1.1). De esta manera la base, vector que
separa ambas cmaras, ser:
B = (100, 0, 100) [ecu. 9.1.1]
La distancia de centro ptico de la cmara 1 a la cuadrcula se medir con la mayor
precisin posible.
La rotacin de la segunda cmara respecto de la primera es la identidad debido a la
manera en que se supusieron colocadas las cmaras.
1 0 0
R = 0 1 0 [ecu. 9.1.2]
0 0 1
Eje y
y
Eje x
M
y
Eje z
S1
S2
P1
C1
V1
V2
P2
C2
Figura 9.1.1 Esquema de la disposicin de las cmaras
Debido a la coplanaridad de los tres vectores V1 B y V2 su producto triple es igual a 0

como se indica en la siguiente ecuacin
62
V1.BR.V2 = 0 [ecu. 9.1.3]

La base B ser expresada en la frmula por la respectiva matriz antisimtrica:
0
~
B = b3
b2
b2
b1 [ecu. 9.1.4]
0
b3
0
b1
Ya que:
~
BR.V2 = B.R.V2 [ecu. 9.1.5]
Llegando a la matriz esencial que permite calcular la rotacin de la cmara 2 respecto

del referencial de la cmara 1
~
V1.B RV2 = 0 [ecu. 9.1.6]
Matriz Fundamental
r
Ahora bien, el vector de la cmara 1, w1 expresado en pixeles ser:
= x + 0 [ecu. 9.1.7]
= y + 0 [ecu. 9.1.8]
Y en forma matricial se puede expresar como:

r
w1 = = 0
1
0

x + 0 . f
f x
f
x + 0
0
0
y = y + . f = y + 0 [ecu. 9.1.9]
f
f
1
1
1
.f
f
f
Donde alfa es la relacin pixeles / mm en x , es la misma relacin pero en la

direccin y , 0 es la coordenada del pie de la perpendicular del eje principal en
pixeles en el eje x , y 0 es la ordenada del pie de la perpendicular en el eje principal
pero en el eje y .
Hemos omitido en la matriz de calibracin, por razones de simplicidad, el coeficiente
que permite calcular el error en la perpendicularidad de los pixeles columna respecto
a los de la lnea.
Entonces recprocamente:
63
x=
0
[ ecu. 9.1.10]
y=
0
[ ecu. 9.1.11]
Con lo cual en forma matricial:

r
w1. C 1
( )
x
= y [ ecu. 9.1.12]
f
0 0
; ; f = (u

1). 0
0
1
0 [ecu. 9.1.13]
Donde C es la matriz de calibracin supuesta igual para ambas cmaras.
64
9.2 Configuracin normal de dos cmaras: Clculo de las coordenadas

del punto objeto (caso particular)
En la figura 9.2.1 se representa una configuracin normal de cmaras como la
utilizada para la toma de imgenes.
Figura 9.2.1 - Configuracin ortonormal de cmaras
En base al teorema de semejanza de tringulos podemos determinar tomando como

origen a la cmara izquierda C1 .
X
Y
Z
= =
X 1 Y1 F1
[ecu. 9.2.1]
De lo cual obtenemos
X =
Y=
X 1Z
[ecu. 9.2.2]
F1
Y1 Z
[ecu. 9.2.3]
F1
Tomando la cmara derecha tenemos por la semejanza de tringulos que

N
Y
Z
=
=
X 2 Y2 F2
[ecu. 9.2.4]
De lo cual obtenemos
65
X 2Z
[ecu. 9.2.5]
F2
y adems
N=
Y=
Y2 Z
[ecu. 9.2.6]
F2
Si observamos la imagen vemos que

X = B+N
cmaras
[ecu. 9.2.7] Siendo B la distancia de separacin horizontal entre
Si reemplazamos en la ecuacin 9.2.2 , de la cmara izquierda el valor de X tenemos
X1Z
[ecu. 9.2.8]
F1
que al reemplazar por el despeje de N (ecu. 9.2.5) obtenido nos queda
B+N =
B+
X 2 Z X 1Z
[ecu. 9.2.9]
=
F2
F1
La distancia focal de ambas cmaras es la misma dado que son del mismo modelo,
salvo defectos de fabricacin que se consideraron despreciables. Entonces tenemos
que F = F1 = F2 por lo que al calcular la coordenada Z despejando de la ecuacin
10.2.9 tenemos
Z=
BF
[ecu. 9.2.10]
(X1 X 2 )
Reemplazando en las ecuaciones 9.2.2 y 9.2.3 tenemos que

X =
X 1Z
[ecu. 9.2.11]
F
Y=
Y1 Z
[ecu. 9.2.12]
F
Se debe tener en cuenta que Y1 = Y2 dado que las cmaras se localizan a la misma
distancia desde la imagen en base a una calibracin.
De esta manera se obtienen las coordenadas tridimensionales (X,Y,Z) de cada uno de
los puntos homlogos seleccionados en el modelo y sobre los cuales se construye el
MNSF.
66
9.3 Configuracin General de Cmaras: Clculo de las coordenadas del

punto objeto
En el caso general de configuracin de dos cmaras el referencial de ambas imgenes
puede no coincidir con el referencial general desplazado a lo largo del eje X , por esta
razn se debe tener en cuenta la rotacin y traslacin de los referenciales de cada una
de las cmaras.
Dado dos referenciales, el general, de centro q y ejes XYZ , y el de una imagen, con
centro en S y ejes xyz , se buscaran las coordenadas de un punto M en el referencial
general, denotado como M q . Y se denomina M S el punto M en el referencial de la
imagen.
X
Problema encontrar Mq = Y
Z
Z
Y
q
X
z
S
p
v
y
Mq(X,Y,Z)
Ms(x,y,z)
Figura 9.3.1 - Configuracin general de cmaras
q ( X , Y , Z ) Referencial general
S ( x, y, z ) Referencial imagen
Se tiene que
SM s = R(qM q qS )
[ecu. 9.3.1]
67
Xs

Siendo R una matriz de rotacin y S = Ys un vector de traslacin.
Z
s
De lo cual se deduce que el punto puede expresarse de la siguiente manera:
x
X Xs
Ms = y = R Y Ys
z
[ecu. 9.3.2 ]
Zs
Se conocen las coordenadas u, v en el referencial de la imagen que son de la

proyeccin del punto M, y tambin la distancia principal o focal .
u
x
=U
z
[ecu. 9.3.3]
Despejando u y v se obtiene
x
u=
[ecu. 9.3.5]
z
v=
y
= V [ecu. 9.3.4]
z
[ecu. 9.3.6]
Despejando x e y se obtiene
u
v
x = z [ecu. 9.3.7]
y = z [ecu. 9.3.8]
Se pueden plantear las siguientes ecuaciones:

x
x
z =0
z
[ecu. 9.3.9]
y
z = 0 [ecu. 9.3.10]
z
x
X
Xs r11r12 r13 X L1
y = R Y R Ys = r21r22 r23 Y + L2 [ecu. 9.3.11]
z
Zs
r31r32 r33 Z
L3
Desarrollando la matriz nos queda

x
r11 X + r12Y + r13 Z + L1 [r31 X + r32Y + r33 Z + L3 ] = 0 [ecu. 9.3.12]
z
y
r21 X + r22Y + r23 Z + L2 [r31 X + r32Y + r33 Z + L3 ] = 0 [ecu. 9.3.13]
z
Siendo
(r11 , r12 , r13 ) = iR [ecu. 9.3.14]
(r21 , r22 , r23 ) = jR

(r31 , r32 , r33 ) = k R
[ecu. 9.3.15]
[ecu. 9.3.16]
68
Reordenando y reemplazando en [ecu. 9.3.12] y [ecu. 9.3.13] con las siguientes

ecuaciones
x
y
= U [ecu. 9.3.17] y
= V [ecu. 9.3.18]
z
z
Podemos expresarlas como
r
i RMq + L1 U k RMq + L3 = 0 [ecu. 9.3.19]
jRMq + L2 V k RMq + L3 = 0 [ecu. 9.3.20]

Reagrupando se obtiene
r
i RMq U k RMq + L1 UL3 = 0 [ecu. 9.3.21]
jRMq V k RMq + L2 VL3 = 0 [ecu. 9.3.22]
Que en forma matricial se puede expresar como

r
i R U kR
jR V k R
Mq =
UL3 L1
VL3 L2
Son conocidos U =
T1
T2
[ecu. 9.3.23]
[ecu. 9.3.24] ,
V =
[ecu. 9.3.25] , qS y la matriz R.
Incgnitas Mq = ( X , Y , Z )
Cada imagen da lugar a 2 ecuaciones con 3 incgnitas, con lo cual tenemos en

definitiva 4 ecuaciones y tres incgnitas. Mediante el uso de cuadrados mnimos es
posible llegar a una solucin nica.
69
9.4 Propiedades de la triangulacin de Delaunay [Priego de los Santos

et al, 2006]
El criterio de Delaunay
Dado un conjunto de puntos P donde existe una triangulacin de esos puntos tal que
la circunferencia circunscripta de cualquier tringulo no contenga ningn vrtice de
otro tringulo.
Propiedad 1 (En Crculo)
Dada una triangulacin T de un conjunto de puntos P, tres puntos pi , p j , pk

pertenecientes a P son vrtices de la misma cara, si y solamente si, el crculo que pasa
por los puntos pi , p j , pk no contiene puntos de P en su interior. (Figura 9.4.1).
Figura 9.4.1 - La propiedad de En Crculo. Figura obtenida de [Priego de los Santos et al, 2006]
Propiedad 2 (Angulo Max.-Min.)

Dos puntos pi y p j pertenecientes al conjunto de puntos P forman un lado de la
triangulacin de Delaunay de P, si y solamente si, existe un crculo que contiene a pi
y p j en su circunferencia y no contiene en su interior ningn otro punto de P. ( ver
figura 9.4.2).
Esto implica que el ngulo mnimo dentro de todos los tringulos est maximizado,
con lo cual tenemos que dadas dos triangulaciones T1 y T2 , T1 es mejor que T2
cuando el menor ngulo de los tringulos de T1 es mayor que el menor ngulo de los
tringulos de T2 .
70
Figura 9.4.2 - Propiedad ngulo max. min. Figura obtenida de [Priego de los Santos et al, 2006]
71
9.5 Desarrollo de la obtencin de las curvaturas de superficie

[Arellano]
Definicin de curvatura:
Si tenemos la funcin paramtrica
r (u , v) = ( x(u , v), y (u , v), z (u , v))
[ecu. 9.5.1]
Y se esta interesado en la evaluacin de la curvatura en el punto (uo, vo)

La direccin del vector normal esta dado por
r u r v [ecu. 9.5.2]
El valor W esta dado por
( r r o ). n [ecu. 9.5.3]
El desarrollo de Taylor sera
W=
1
D (uo , vo ).h 2 + 2.D' (uo , vo ).h.k + D' ' (uo , vo ).k 2 + O ( 2 )
2
[ecu. 9.5.4]
1
D(uo , vo ).h 2 + 2.D' (uo , vo ).h.k + D' ' (uo , vo ).k 2
2
] [ecu. 9.5.5]
A partir del cual se obtiene el paraboloide osculador de la superficie con
D = r 11 . n =
D' = r 12. n =
( ruu , ru , rv ) d
= [ecu. 9.5.6]
(ruv , ru , rv ) d '
=
[ecu. 9.5.7]
D' ' = r 22 . n =
(rvv , ru , rv ) d ' '

=
[ecu. 9.5.8]
Siendo
72
d =
2x
u 2
x
u
x
v
2y
u 2
y
u
y
v
2x
uv
x
d '=
u
x
v
2y
uv
y
u
y
v
2x
v 2
x
d ''=
u
x
v
2y
v 2
y
u
y
v
2z
u 2
z
u
z
v
[ecu. 9.5.9]
2z
u v
z
u [ecu. 9.5.10]
z
v
2z
v 2
z
u
z
v
[ecu. 9.5.11]
x y z
2
E = r1 = + + [ecu. 9.5.12]
u u u
F = r1.r2 =
x x y y z z
. + . + . [ecu. 9.5.13]
u v u v u v
2
x y z
2
G = r2 = + + [ecu. 9.5.14]
v v v
= E.G F 2 [ecu. 9.5.15]
73
Las curvaturas principales son obtenidas transformando la cuadrtica a la forma

cannica.
Los autovalores de esta matriz
D
D'
D'
D' ' [ecu. 9.5.16]
Son las races de la ecuacin:

( D.D' ' D' 2 ).R 2 ( E.D ' '2.F .D '+G.D).R + ( E.G F 2 ) = 0 [ecu. 9.5.17]
Y dan las curvaturas principales del paraboloide oscilador, donde D, D y D son los
coeficientes de la segunda forma fundamental de la superficie
D=r11 N [ecu. 9.5.18] D=r12.N [ecu. 9.5.19] D=r22.N [ecu. 9.5.20]
E=r12 [ecu. 9.5.21] F=r1.r2 [ecu. 9.5.22] G =r22 [ecu. 9.5.23]
r11, r12, r22 son las derivadas parciales de segundo orden de r respecto de los
parmetros y r1. r2 son los vectores tangente a las lneas u y v en el punto M
por donde pasa el plano tangente.
Si llamamos A y C a las curvaturas principales, se obtiene la expresin cannica
2 z = A. x 2 + C. y 2 [ecu. 9.5.24]
La curvatura Sophie GERMAIN (promedio) en el punto M es obtenida por la
expresin:
S .G. = A + C [ecu. 9.5.25]
Y la curvatura de Gauss esta dada por:

Gauss = AC [ecu. 9.5.26]
El punto puede ser clasificado en elptico, hiperblico o parablico de acuerdo con los
tres siguientes casos respectivamente:
Elptico: AC > 0
Hiperblico: AC <0
Parablico: AC = 0
74
75
10 Referencias y bibliografa
Akarun, L., Gokberk, B., Salah, A. A. 3D Face Recognition for Biometric
Applications. Department of Computer Engineering. Bogazici University, Bebek,
Istanbul, Turkey
Android Ice Cream Sandwich review , web Slash Gear. En lnea. Accedido 12 de
septiembre del 2013.
http://www.slashgear.com/android-ice-cream-sandwich-review-21196969/
Arellano, M. A., Ryckeboer H. The curvature of digital models for parametric

surfaces. (no publicado) .
Berreti, S., Del Bimbo, A., Pala, P., Silva Mata, F. J. Geodesic distances for 3D-3D
and 2D-3D face recognition. Multimedia and Expo, 2007. IEEE International
Conference on Volume, Issue , 2-5. July 2007. Page(s):1515 1518
Balakrishnama, S., Ganapathiraju, A. Linear Discriminant Analysis-A Brief Tutorial.
http://www.music.mcgill.ca/~ich/classes/mumt611_07/classifiers/lda_theory.pdf. En
linea. Accedido 9 septiembre del 2013.
Belhumeur, P. N., Hespanha, J. P., Kriegman, D. J. Eigenface vs Fisherface:
Recognition Using Class Specific Linear Projection. IEEE Transactions on Pattern
Analysis and Machine Intelligence. Vol. 19. NO. 7. July 1997
Bize, Ali. Trabajo profesional de Ingeniera en Informtica. 2012. No publicado
Blackburn, Duane. Face Recognition. National Science Technology Council
Committee on technology Committee on homeland and National Security
Subcommittee on Biometrics. 2006.
Bronstein, Alexander M. Bronstein, Michael M., Kimmel Ron. Three-Dimensional
Face Recognition . Internacional Journal of Computer Vision. Vol 64 Issue 1, August
2005 , Pages 5-30
Border crossing Border Crossings: morpho has developed a biometric solution
for australia . En lnea. Accedido 12 de septiembre del 2013.
http://www.morpho.com/references/border-control-127/border-crossings-morpho-hasdeveloped-a-biometric-solution-for-australia?lang=en
76
Bowyer, K. W., Chang, K., Flynn, P. A Survey of Approaches to Three Dimensional

Face Recognition . Department of Computer Science and Engineering, University of
Notre Dame. Notre Dame. 2004. IN 46556, USA
Bowyer, K. W., Chang, K., Flynn, P. A survey of approaches and challenges in 3D
and multi-modal 3D+ 2D face recognition. Department of Computer Science and
Engineering. University of Notre Dame. Notre Dame. IN 46556, USA. 2005.
CGAL CGAL, Computational Geometry Algorithms Library. En lnea. Accedido
20 junio del 2013.
http://www.cgal.org/Manual/last/doc_html/cgal_manual/Triangulation_2/Chapter_ma
in.html.
Chinese Face Database Universidad de Beijing. The BJUT-3D Large-Scale
Chinese Face Database. MISKL-TR-0-FMFR-001. 2005.
Cuevas de Lascaux Wikipedia, the free encyclopedia. En lnea. Accedido 12 de
diciembre del 2013. http://es.wikipedia.org/wiki/Cueva_de_Lascaux
Curva ROC Wikipedia, the free encyclopedia.En lnea. Accedido 12 de diciembre
del 2013. http://es.wikipedia.org/wiki/Curva_ROC
Facial Recognition - Wikipedia, the free encyclopedia. En lnea. Accedido
Septiembre 9 del 2013. http://en.wikipedia.org/wiki/Facial_recognition_system
FaceSDK Luxand FaceSDK. En lnea. Accedido 3 de diciembre del 2013.
http://www.luxand.com/facesdk/index.php.
Fernndez Snchez, M. C. MBITOS. Revista Andaluza de Comunicacin. Nmero
3-4 - Ao 2000 - Universidad de Sevilla
Garcia Rio, E. Una introduccin a la curvatura. 2003. En lnea. Accedido 20 de junio
del 2013.
http://findpdf.net/pdf-viewer/Una-introduccion-a-la-curvatura.html
G. Gordon, Face recognition based on depth maps and surface curvature.
SPIE, Geometric Methods in Computer Vision, vol. 1570, pp. 108-110, Julio1991
Gkberk, B. Three dimensional face recognition Thesis. 2006 . En lnea. Accedido
15 de julio del 2013. http://www.vanderberk.com/
77
Gupta, S., Aggarwal, J. K., Markey, M. K., Bovik, A. C. 3D Face recognition

founded on the structural Diversity of human faces. IEEE CVPR. 2007. Minneapolis.
MN.
Haar, F., Veltkamp, R. SHREC08 Entry: 3D Face Recognition using Facial Contour
Curves. Shape Modeling International, page 259-260. IEEE, (2008)
Kanade, T. Picture Processing system by computer complex and recognition of
human faces. Dept. Of Information Science , Kyoto University, Nov. 1973.
Karima Ouji, Boulbaba Ben Amor, Mohsen Ardabilian,Faouzi Ghorbel, Liming Chen.
3D Face Recognition using ICP and Geodesic Computation Coupled Approach.
Multimedia Systems and Applications Series Volume 31, 2008, pp 141-151
La vida en 3D Museo de la ciudad. En lnea. Accedido 12 de septiembre del 2013.
http://www.museodelaciudad.org.ar/?page_id=172
Lecumberry,F. Clculo de disparidad en imgenes estreo, una comparacin.
Congreso Argentino de Ciencias de la Computacin, 11. Cacic 2005. Concordia,
Argentina. - oct 2005 Research Group: gti
Martnez, D., Velho, L., Carvalho, P., Computing Geodesics on Triangular Meshes.
Computer Graphics and Image Processing. 2004. Proceedings. 17th Brazilian
Symposium on Volume , Issue. 17-20 Oct. 2004 Page(s): 210 217
Mazo Quintas, M. Visin por computador. 2005. En lnea. Accedido 17 de julio del
2013.
http://www.profesaulosuna.com/data/files/ROBOTICA/ROBOTICA%20SENSORES
/VISION/transparencias_vision(IV).pdf
Mpiperis, I. , Malassiotis, S. , Strintzis, M. Expression Compensation for face
recognition using a polar geodesic representation. 3D Data Processing, Visualization,
and Transmission, Third International Symposium. Page 224 231. 2006
Pereyra, P. Zelasco, J. F. Donayo, J. Estado del arte en reconocimiento facial. II
Tomo del 2013 de los Anales de la Sociedad Cientfica Argentina. 2013
Prez de la Blanca Capilla, N. Fundamentos del Tratamiento de Imgenes. Visin por
Computador. 1995. En lnea. Accedido 15 de julio del 2012.
http://www6.uniovi.es/vision/intro/
78
Phillips, P. J., Todd Scruggs, W., OToole, A. J., Flynn, P. J., Bowyer, K. W., Schott,
C. L., Sharpe, M: FRVT 2006 and ICE 2006 Large-Scale Results. Marzo 2007.
Priego de los Santos, J. E., Porres de la Haza, M. J. La triangulacin de Delaunay
aplicada a los modelos digitales del terreno. Departamento de Ingeniera
Cartogrfica, Geodesia y Fotogrametra. Universidad Politcnica de Valencia. En
lnea. Accedido 20 de noviembre 2013
http://age.ieg.csic.es/metodos/docs/doc1_8.pdf.
Reyes Enciso, A. S., Neumannb, U., Mah, J. 3D head anthropometric analysis. SPIE
Symposium on Medical Imaging. 2003, San Diego, CA, USA.
Rios, Javier Eslava. Reconocimiento Facial En Tiempo Real. rea de Tratamiento de
Voz y Seales. Dpto. de Ingeniera Informtica. Escuela Politcnica Superior
Universidad Autnoma de Madrid. Julio 2013. En lnea. Accedido 5 diciembre 2013.
http://arantxa.ii.uam.es/~jms/pfcsteleco/lecturas/20130717JavierEslavaRios.pdf.
Samani, A., Winkler, J., Nirajan, M. Automatic Face Recognition Using Stereo
Images. Acoustics, Speech and Signal Processing. ICASSP 2006. Proceedings. 2006
IEEE International Conference on Volume 5, Issue , 14-19 May 2006 Page(s):V V.
The University of Sheffield, Department of Computer Science, Sheffield S1 4DP,
UK, 2006
Sanchez Moreno, F. M. Reconstruccin 3D con iluminacin lser: Aplicaciones a la
fotogrametra industrial. Capitulo 3: Visin 3D estereoscpica. 2000
Seguridad futurista Seguridad futurista: cajeros Globalnet reconoceran rostro de
En
lnea.
Accedido
12
de
septiembre
del
2013.
usuarios.
http://elcomercio.pe/economia/peru/seguridad-futurista-cajeros-globalnetreconocerian-rostro-usuarios-noticia-1493707
Shu-Wei Lin, Shu-Shen Hao, Jui-Lun Chang, Sheng-Yi Li. 3D Face Recognition
Based on Curvature Feature Matching, with Expression Variation. Intelligent
Autonomous Systems 12, Volume 1 Proceedings of the 12th International Conference
IAS-12, held June 26-29, 2012, Jeju Island, Korea, pp 289-299.
Sirovich, L. Kirby, M. A Low-Dimensional Procedure for the Characterization of
Human Faces. J. Optical Soc. Am. A, 1987, Vol. 4, No.3, 519-524.
Sigari M. H., Rahmani A. T. Optimized Elastic Bunch Graph Matching using Genetic
Algorthim for Face Recognition. 2007. En lnea. Accedido 20 de septiembre del 2013.
http://confbank.um.ac.ir/modules/conf_display/conferences/isfs2007/pdf/i441.pdf
79
Surazhsky, V., Surazhsky, T. Kirsanov, D., Gortler, S., Hoppe, H. Fast Exact and
Aproxmate Geodesics on Meshes. ACM. SIGGRAPH 2005, pp. 553560 (2005)
Teknomo, Kardi. Discriminant Analysis Tutorial. 2006. En lnea. Accedido 20 de
septiembre del 2013.
http://people.revoledu.com/kardi/tutorial/LDA/
Turk, M., and Pentland, A., Eigenfaces for recognition. Journal of Cognitive
Neuroscience. Vol, 3. pp. 71-86. 1991.
Welling, M. Fisher Linear Discriminant Analisys. Department of Computer Science.
University of Toronto. 2008 . En lnea. Accedido 20 de septiembre del 2013.
http://www.ics.uci.edu/~welling/classnotes/papers_class/Fisher-LDA.pdf
Wiskott, L. Fellous, J. M., Krger, N., von der Malsburg, C. Face Recognition by
Elastic Bunch Graph Matching. In Intelligent Biometric Techniques in Fingerprint
and Face Recognition, eds. L.C. Jain et al., publ. CRC Press, ISBN 0-8493-2055-0,
Chapter 11, pp. 355-396, 1999
Zelasco, J. F., Mndez, D. E., Donado, A. V. Estereopsis automtica panorama del
estado del arte. Anales de la Sociedad Cientfica Argentina. 1998.
Zhao, W., Chellappa, R., Rosenfeld, A, Phillips, P. J.. Face Recognition: A Literature
Survey, ACM Computing Surveys. 2003. pp. 399-458.
Zhao, H., Yuen, P. C. Incremental Linear Discriminant Analisys for Face
Recognition. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND
CYBERNETICSPART B: CYBERNETICS, VOL. 38, NO. 1, FEBRUARY 2008.
80

ADMINISTRACION

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ADMINISTRACION

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE BUENOS AIRES

Pamela Alejandra Pereyra (papereyra@gmail.com)

Lic. Jos Francisco Zelasco

Lic. Judith Donayo

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

Este trabajo se orienta al reconocimiento de las caras a partir de sus modelos

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

lo que permiten comparar MNSF tomados en distintos momentos. Para ello es

1.2 Estructura de la tesis

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

En el captulo 6 se realiza un informe de verificacin experimental de los resultados

Figura 1.2.1 - Pasos a seguir para el reconocimiento de rostros

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

2 Estado del arte [Pereyra, P. et al, 2013]

Aplicacin de la ley y vigilancia

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

2.1 Comienzos de la estereoscopa

Figura 2.1.1 - Pintura de cueva de Lascaux en Francia.

El inters por el fenmeno de la tridimensionalidad visual se remonta a la Grecia

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

Figura 2.1.2 - Estereoscopio de Charles Wheatstone.

2.2 Historia del reconocimiento facial

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

2.2.1 Clasificacin de los mtodos de reconocimiento facial

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

En el caso de los hbridos, se utiliza un sistema de percepcin ms similar al humano,

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

78630 - Pamela Alejandra Pereyra

Universidad de Buenos Aires

Reconocimiento Facial Mediante Imgenes Estereoscpicas Para Control de Ingreso

De acuerdo con la totalidad de la bibliografa sobre reconocimiento facial, se admite

2.3.1 Tcnicas de obtencin de modelos 3D

78630 - Pamela Alejandra Pereyra