Está en la página 1de 6

1

Reconocimiento de Rostros mediante Puntos


Caracterı́sticos Locales
Alexander Ocsa M. , Alexander Rodriguez V. , Herbert Chuctaya H. , Gabriel Humpire M.
Resumen — Este artı́culo presenta una comparación entre dos métodos de extracción de caracterı́sticas locales. La
propuesta para la identificación de puntos caracterı́sticos locales en los rostros usa la técnica Active Shape Model (ASM).
El primer método crea el vector caracterı́stica considerando las distancias que forman en el grafo de Delaunay sobre
los puntos localizados por ASM . El segundo método, con los mismos puntos se define una región localizada donde
cada punto caracterı́stico de 7x7 pixeles sirve para formar vectores caracterı́sticas de componentes Wavelets en base
a una familia de transformadas Wavelet en distintas escalas y orientaciones. Este enfoque permite que la propuesta
sea invariante a rotación, traslación y escala. Con las caracterı́sticas obtenidas se realiza una comparación paramétrica
con los vectores de las imágenes almacenadas en la base de datos conformantes de un conjunto de entrenamiento. Los
experimentos fueron hechos con la base de datos de BioIDFaceDataBase, con el cual se obtuvo un grado promedio
de reconocimiento de 93 % (método 1) y 96 % (método 2).
Términos de indexación — Reconocimiento facial, ASM, gabor, wavelets

1. Introducción la computación, tales como mineria de datos, bioin-


formática y compresión de video. Los Métodos de Acceso
Desde la percepción humana, la forma más sencilla de Métrico (MAM) son considerados buenos para resolver
reconocer personas es mediante el rostro, este tiene carac- búsquedas por similitud ya que son diseñadas para tra-
terı́sticas únicas como la distancia entre los ojos, anchura bajar sobre espacios métricos reduciendo el costo de la
de la nariz, forma de la barbilla, pómulos, forma de la bo- búsqueda.
ca, etc. En este trabajo presentamos un estudio comparativo
La detección de personas en una imagen o vı́deo es entre dos técnicas basado en caracterı́sticas locales. El
un tema ambicioso desde hace ya bastante tiempo, y ca- componente principal de este trabajo es el uso de ASM
da vez se exige una mayor precisión ante entornos cada como técnica para la identificación de puntos locales. Los
vez más difı́ciles. Daidi [12] explica el principal problema experimentos se realizaron comparando la precisión de
que se presenta es que las caracterı́sticas del rostro varı́an los resultados luego de hacer consultas de los K vecinos
en pequeñas modificaciones de la posición o gestos del más cercanos sobre un Método de Acceso Métrico.
rostro. Aplicaciones como: sistema de seguridad, identi- El artı́culo esta estructurado de la siguiente forma : en
ficación de criminales, control fronterizo de emigrantes, la sección 2 se verá el estado del arte, en la sección 3 nues-
evitar suplantaciones por pérdida de documentos, etc uti- tra propuesta, en la sección 4 los resultados finalizando en
lizan técnicas de reconocimiento de rostros. la sección 5 las conclusiones de los resultados del articulo.
En intentos de solucionar estas problemáticas surgen
técnicas como Active Shape Model (ASM) , Principal Com-
ponent Analysis (PCA) y Active Appearance Model (AMM) 2. Estado del Arte
descritos por Taylor [3]. Estas técnicas pueden ser clasifi-
cados en métodos basados en caracterı́sticas locales que Son varios los problemas que se presentan al realizar
generalmente usan distancias biométricas y globales que reconocimiento de rostros en imágenes como: la detec-
consideran el todo de la imagen para extraer información ción del rostro y búsqueda de la persona a la que más
acerca del color y la textura. Las técnicas basados en car- se asemejan las caracterı́sticas extraı́das. En esta sección
acterı́sticas globales consideran caracterı́sticas generales se discutirá de manera general los trabajos relacionados a
de la imagen más no consideran el contenido especı́fico esta área. Ver Zhao [11] que es un survey sobre el estado
de la imagen que es un rostro. del arte en reconocimiento de rostros.
Una de los formas de responder consultas sobre una Existen varios modelos para tratar este problema, es-
base de datos de rostros de forma rápida es usando Méto- tos son explicados ampliamente por Taylor [3], donde de-
dos de Acceso. En general las comunidades de Recu- fine amplia información sobre ASM , PCA y AMM. Para
peración de Información usan Métodos de Acceso debido obtener mayor detalle Taylor [2] muestra una comparati-
a sus extensas bases de datos en una forma eficiente aún va en el tiempo entre los metodos ASM y AAM.
en dimensiones grandes. D. Cristinacce y N. Butcher [4] ASM muestran estu-
Por otro lado, la búsqueda por similitud ha sido am- dio comparativo entre un conventional feature detector clas-
pliamente usada en muchas áreas de las ciencias de sifier y boosted regression predictor. El primer modelo que
Cesar A. Beltrán Castañon es Presidente de la Sociedad Peruana
aprende a discriminar funciones entre la apariencia y car-
de Computación (SPC) ,profesor en la Universidad Nacional de San acterı́sticas entre los más cercanos. El segundo modelo
Agustı́n (UNSA) y Universidad Católica Santa Marı́a (UCSM) aprende a relacionar entre las apariencias de vecinos lo-

Published by SCGI 2008


2

Figura 1: Diagrama de contexto de nuestra propuesta

cales de una localización de caracterı́sticas verdadera. 3.1. Ubicación de puntos en rostros con Ac-
Para el reconocimiento existen varios compendios que tive Shape Model (ASM)
explican el estado del arte se puede ver en [11] en el que
explica varios temas sobre la detección del rostro y su rep- Para la ubicación de los puntos caracterı́sticos en el ros-
resentación. J. Buhmann Et.Al. [6] y Lades Et.Al. [7] usan tro se usa Active Shape Model (ASM) que crea un modelo
Wavelets de Gabor para la extracción de caracterı́sticas. de las caracterı́sticas que se desee encontrar. Este modelo
esta definido por una serie de puntos(vértices), ası́ como
En cuanto a la representación del grafo creado por los
la conexión entre los puntos(aristas). Examina la región
nodos obtenidos por la plantilla del modelo Face Bunch
alrededor de cada punto encontrado en la imagen para
Graph presenta una “arquitectura” robusta de un grafo
encontrar la mejor “opcion“ en la imagen que se ajuste
que asocia a cada nodo un conjunto jets (valores imaginar-
a los demás puntos. El modelo es emparejado de punto
ios) de caracterı́sticas de Gabor explicado por Wiskott [9]
a punto para ubicar de una forma adecuada los puntos
en el articulo Face recognition by elastic bunch graph match-
sobre la imagen. La adecuación se realiza utilizando los
ing. Asi mismo, Changbo Hu y Rogerio Feris [5] definen
bordes de imagen.
al modelo ASM como un método que detecta puntos
En la figura 2 se muestra como se extraen algunas car-
por medio de una búsqueda acotada en modelos de for-
acterı́sticas de la imagen a tratar, posteriormente dichas
mas globales, con aprendizaje estadı́stico de un conjunto
caracterı́sticas serán analizadas por el modelo ASM para
de entrenamiento, una forma, es aquella información ge-
determinar si dicho objeto es un rostro. Para identificar
ométrica que cuando se ha quitado la escala, posición o
los puntos locales es necesario detectar la región del ros-
rotación sigue siendo la misma. Por tanto ASM también
tro en la imagen utilizando el algoritmo Haar Cascade. El
puede ser utilizado como plantilla de modelo al igual que
éxito de localizar los puntos caracterı́sticos depende de la
Face Bunch Graph. El árbol Slim tree propuesto por Traina
correcta detección del rostro.
Jr [1] introduce un nuevo algoritmo de división basado en
Minimum spanning tree (MST) e introduce un medidor de
solapamiento llamado Fat-factor. El algoritmo Slim-down
es usado para reducir el grado de solapamiento, haciendo
el árbol métrico más eficiente de esta manera mejora las
consultas y funcionamiento.

Figura 2: Extracción de caracterı́sticas de una imagen tras ten-


er previamente detectada el área del rostro.
3. Propuesta
En la figura 3 se muestra los puntos extraı́dos por ASM,
En la figura 1 se presenta el diagrama de contexto estos puntos se ubican según variables de configuración
donde se muestra los pasos de los procesos que se irán del algoritmo, se procede ubicando una plantilla sobre la
detallando en las siguientes secciones. parte de la imagen que contiene un rostro.
3

3.3. Procesamiento con Wavelets de Gabor


La representación de puntos locales esta basado en la
transformada Wavelet de Gabor. La transformada de Ga-
bor realiza un análisis de la señal con el cual es posi-
ble representar en cada instante de tiempo, las compo-
nentes de la señal. Se trata pues de un dominio tiempo-
frecuencia. Los wavelet de Gavor son formados multipli-
Figura 3: Plantilla de ASM que debe ser aplicada a un rostro y
cando un senoide con una función Gausiana. La función
tratar de ubicar las mejores posiciones para obtener los respec-
Gaussiana tiene un efecto limitador, aquı́ los valores de
tivos puntos representativos
cada pixel cercanos a un punto caracterı́stico del rostro
contribuyen a la convolución.
El conjunto de coeficientes de convolución para los ker-
Una vez obtenidos los puntos, se procede a localizar los
nels de diferentes orientación y escala sobre cada punto
ojos para realizar el escalamiento de modo que todos los
caracterı́stico forma el vector de caracterı́stica local.
grafos resultantes tengan la misma distancia.
Cada componente wavelet describe una sección de val-
ores en escala a grises en una imagen I(x) alrededor de
un pixel x = (x, y). Este esta basado en la transformada
3.2. Creación del Grafo de Gabor, definido como una convolución.

En la figura 4 se muestra el resultado de aplicar el algo-


ritmo de Delaunay Triangulation (DT) [8] tomando como
puntos referenciales los ubicados por el algoritmo ASM.

3.4. Extracción de Caracterı́sticas

Figura 4: La plantilla Active Shape Model (ASM) que se mues-


tra en diferentes ángulos

En la figura 5 se muestra un ejemplo de un rostro que


fue solapado por los puntos encontrados con ASM y la
respectiva malla creada por el paso anterior.

Figura 6: Para la realización de una consulta se extraen las car-


acterı́sticas del rostro en base a los puntos locales identificados
por Active Shape Model (ASM), luego se procede a hacer la con-
sulta por similitud en la base de datos con vector caracterı́stica
obtenido

La extracción de caracterı́sticas es una parte fundamen-


tal de un sistema de reconocimiento de personas. Este
tiene la información de formas particulares para rostros
diferentes. En el presente trabajo se considera 68 puntos
Figura 5: Un rostro ubicado por la plantilla de Active Shape extraı́dos del rostro que ubican el contorno del rostro, las
Model (ASM) y el mallado creado por el algoritmo de Delau- cejas, ojos, nariz y boca. En la Figura 6 se muestra el pro-
nay que será usado para poder extraer las caracterı́sticas usando ceso general de una consulta considerando tanto la ex-
Gabor tracción de caracterı́sticas y la comparación con los datos
indexados.
4

BioID, disponible en la web en http://www.bioid.com/


downloads/facedb/. La base de datos BioID es mostrada
en la figura 8 tiene las siguientes caracterı́sticas:

Figura 7: Para cada rostro encontrado se crea una grafo con los
puntos de Active Shape Model (ASM) Figura 8: Base de datos BioID.

Con los puntos locales obtenidos con ASM se genera el


1. Por cada persona se tiene 10 imágenes
grafo de Delaunay correspondiente.
Los vectores caracterı́sticos son obtenidos de dos for- 2. Vista frontal de los rostros.
mas:

1. Considerando las distancias que forman en el grafo 3. Un total de 1521 imágenes.


de Delaunay formado con los puntos localizados con
4. Un total de 23 personas distintas.
ASM.

2. Con los mismos puntos se define una región local- 5. Variación de luz.
izada donde por cada punto caracterı́stico del rostro
(x, y) se forma una matriz de tamaño 7x7, que fue 6. Resolución de 384x286 pixeles
determinada empı́ricamente, cuyo centro es (x, y).
Los componentes Wavelets son formados por medio 7. Imágenes en escala gray.
de la interpolación de los componentes wavelets de
cada posición que define la matriz. Estos compone- 8. Expresiones faciales (Ojos abiertos, Ojos cerrados,
nentes wavelets son obtenidos luego de usar una fa- Sonriente, Triste)
milia de transformadas Wavelet a distintas escalas
9. Formato PGM.
y orientaciones. Se utiliza la parte real e imaginaria,
con 5 escalas y 8 orientaciones diferentes. El resul-
10. Detalles faciales (Con lentes, Sin lentes).
tado contiene 40 coeficientes que consisten en com-
ponentes wavelets para cada punto caracterı́stico del Se tomo 3 conjuntos de prueba para hacer las compara-
rostro. Los valores de escalas que son usados varı́an ciones, cada conjunto de prueba esta constituido por un
de [−1 : 1] en un factor de 0,5. Las orientaciones son grupo de 10 imágenes de una misma persona en distin-
múltiplos de π/8. tas circunstancias de iluminación, posición, rotación y/o
Entonces obtenemos dos tipos de vectores caracterı́sti- escala.
cas: (1) En base a las distancias de las aristas del grafo Se realizó dos tipos de experimentos. En el primero se
de Delaunay (caracterı́sticas locales en base a distancias) le utilizo extracción de caracterı́sticas en base a las dis-
(2) Los componentes wavelets por cada nodo del grafo de tancias entre las aristas del grafo y el segundo se le hizo
Delaunay (caracterı́sticas locales en base a wavelets). La un análisis de las imágenes aplicando la transformada de
métrica utilizada es la distancia euclideana para ambos wavelets de Gabor.
métodos comparando distancias entre las aristas para el En [10] se propone el uso de un solo punto como
método 1 y el valor de la amplitud obtenido en base al parte de los puntos caracterı́sticos del rostro para obtener
valor real e imaginario para el método 2. los vectores caracterı́sticos locales utilizando Gabor [7], a
diferencia de nuestra propuesta al usar una matriz de 7x7
obteniendo mejores resultados.
4. Experimentos En el cuadro 1 se muestra resultados generales com-
parando ambas técnicas.
Para los experimentos se usaron imágenes de ros- En las gráficas 9 (a), 9 (b), 9 (c) de Recall And Precision
tros de una base de datos libre que pertenece a se determina el grado de precisión de cada técnica sobre
FGnet project of the European Working Group llamada distintos conjuntos de prueba.
5

Test CLDistancias CLGabor


Test1 90.85 94.86
Test2 95.55 98.50
Test3 92.42 96.86

Cuadro 1: Resultados de grados de reconocimiento


promedio para los distintos conjuntos de prueba. Estos
resultados están en base a una consulta 1-Nearest Neigh-
bor
(a)

5. Conclusiones
En este artı́culo se compara dos métodos de extrac-
ción de caracterı́sticas locales para el reconocimiento de
rostros basado en Active Shape Model (ASM). Primero se
identifica puntos caracterı́sticos del rostro, en base a eso
se construye el grafo de Delaunay, el primer método uti-
liza las distancias obtenidas de las aristas del grafo, el se-
gundo método se basa en componentes wavelets identi- (b)
ficados por cada punto caracterı́stico del rostro luego de
aplicar una serie de transformadas wavelets a distintas
escalas y orientaciones. Este enfoque permite que nuestra
propuesta sea invariante a distintas funciones de trans-
formación como son: rotación, escala y traslación.
A diferencia del trabajo [10], en vez de Face Bunch
Graph como plantilla del modelo a utilizar para gener-
ar el grafo de caracterı́sticas locales este trabajo utiliza
ASM. Además la propuesta hace uso de una matriz de
7x7 identificada de manera empı́rica con el cual se con-
(c)
sigue mejores resultados.
Los experimentos muestran un grado promedio de re-
Figura 9: Gráficas Precision and Recall comparando las
conocimiento de 93 % para el primer método y 96 % para
técnicas CLDistancias y CLGabor (a) Conjunto de prueba
el segundo método. El segundo método tiene un grado
1 (b) Conjunto de prueba 2 (c) Conjunto de prueba 3
de reconocimiento mayor para mayores grados de recall,
pero con un costo de procesamiento de datos más alto.
Para trabajos futuros se investigará sobre los parámet- [3] T.F. Cootes and C.J.Taylor. Statistical models of appear-
ros de optimización para ambas técnicas comparandolo ance for computer vision. In Imaging Science and Biomed-
con métodos basado en caracterı́sticas globales, como por ical Engineering, Manchester M13 9PT, U.K., 2004. http:
ejemplo técnicas basados en proyección como Principal //www.isbe.man.ac.uk/~bim/refs.html.
Component Analysis (PCA). [4] D. Cristinacce and T. Cootes. Boosted regression active
shape models. In 18th British Machine Vision Conference,
Warwick, UK, pages 880–889, 2007.
Agradecimientos [5] Changbo Hu, Rogerio Feris, and Matthew Turk. Real-time
view-based face alignment using active wavelet networks.
In AMFG ’03: Proceedings of the IEEE International Workshop
Los autores agradecen al Profesor César Beltrán por su
on Analysis and Modeling of Faces and Gestures, page 215,
apoyo y consejos. Washington, DC, USA, 2003. IEEE Computer Society.
[6] M. Lades J. Buhmann and C. von der Malsburg. Size
and distortion invariant object recognition by hierarchical
Referencias graph matching. In Proceedings of The IEEE Internation-
al Symposium on Workload Characterization (IISWC), pages
[1] Jr. C. Traina, A. Traina, C. Faloutsos, and B. Seeger. Fast 411–416, San Diego, CA, September 1990.
indexing and visualization of metric data sets using slim- [7] VORBRUGGEN J.-BUHMANN J. LANGE J. MALSBURG
trees. IEEE Trans. on Knowl. and Data Eng., 14(2):244–260, C. V.D. WURTZ R. LADES, M. and W. KONEN. Distortion
2002. invariant object recognition in the dynamic link architec-
[2] T.F. Cootes and C.J.Taylor. Timeline of developments in ture. page 300–311, 1993.
asms and aams. In Imaging Science and Biomedical Engineer- [8] Gary L. Miller. A time efficient delaunay refinement al-
ing, Manchester M13 9PT, U.K., 2003. http://www.isbe. gorithm. In SODA ’04: Proceedings of the fifteenth annual
man.ac.uk/~bim/refs.html. ACM-SIAM symposium on Discrete algorithms, pages 400–
6

409, Philadelphia, PA, USA, 2004. Society for Industrial


and Applied Mathematics.
[9] FELLOUS J.-M. WISKOTT, L. and C. VON DER MALS-
BURG. Face recognition by elastic bunch graph matching.
page 775–779., 1997.
[10] Laurenz Wiskott, Jean-Marc Fellous, Norbert Krüger, and
Christopher von der Malsburg. Face recognition by elastic
bunch graph matching. IEEE Trans. Pattern Anal. Mach.
Intell., 19(7):775–779, 1997.
[11] W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosen-
feld. Face recognition: A literature survey. ACM Com-
put. Surv., 35(4):399–458, 2003. http://doi.acm.org/10.
1145/954339.954342.
[12] Daidi Zhong and Irek Defée. Performance of similarity
measures based on histograms of local image feature vec-
tors. Pattern Recogn. Lett., 28(15):2003–2010, 2007.