Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VIABLE DE IDENTIFICACIN
Miguel A. Carrasco, Roberto Portugal, Billy Peralta
Departamento de Ciencia de la Computacin
Pontificia Universidad Catlica de Chile
Av. Vicua Mackenna 4860(143), Santiago de Chile
{ mlcarras@puc.cl, rportug@ing.puc.cl, bmperalt@puc.cl }
Abstract: Los sistemas biomtricos se han convertido en una realidad cotidiana para las
personas. Da a da vemos como su uso se ha extendido a las actividades comerciales,
privadas, gubernamentales, etc. Nuestra investigacin plantea el uso de dos medidas
biomtricas, que en general tienen un bajo rendimiento en forma independiente; sin embargo,
demostramos que su utilizacin en forma combinada es una alternativa viable como medio de
identificacin. Para ello utilizamos tcnicas de extraccin de caractersticas en rostro y audio,
algoritmos de seleccin y clasificacin en forma independiente y combinada. Los resultados
obtenidos indican que es factible identificar el 100% de las personas utilizando estas dos
mtricas en combinacin. Copyright 2006
Key Words: Biometric Recognition, Facial Features, Speaker Recognition, EigenFaces,
Cepstral analisis, PCA-eigenfaces, MFCC, Stacked Generalization
1. INTRODUCCIN
Los seres humanos poseen una alta capacidad para
reconocer rostros y voces an en escenarios donde
existan altos niveles de variabilidad y ruido. Disear
sistemas automticos que emulen esta propiedad
natural de los humanos, constituye una tarea
compleja y con muchas limitaciones. Probablemente
una de las primeras interrogantes sea los rostros y
voces son diferenciables como medidas biomtricas?
Afortunadamente en los ltimos aos se han
realizado una gran cantidad de investigaciones que
afirman esta interrogante, en especial el rea de la
biometra.
Los sistemas biomtricos se basan en el
reconocimiento de patrones (Prabhakar et al., 2003).
Un patrn biomtrico est compuesto por un
conjunto de caractersticas fisiolgicas y sicolgicas
que definen un vector asociado unvocamente a una
persona. Utilizando esta informacin, es posible
verificar e identificar un vector de caractersticas
dentro de una base de datos con informacin de otras
personas. La importancia de disear un sistema
automtico depende principalmente del contexto
donde se utiliza el reconocimiento. Las aplicaciones
y boca para determinar sus caractersticas (PintoElias & Sossa-Azuela, 1998). El segundo enfoque,
est basado en las caractersticas invariantes. Para
ello utiliza la informacin intrnseca de la imagen, es
decir, el color, la textura, forma y tamao y sus
combinaciones. El objetivo consiste en detectar
patrones en la imagen para segmentar l o los rostros
contenidos. Muchas veces, es necesaria una
transformacin a otros espacios como el YCbCr o
HSV. En este ltimo caso, es sabido que el color de
la piel en otros espacios est contenido en un rango
limitado del histograma, por lo tanto, gran parte de
ste es segmentado (Padilla & Fan, 2003). El tercer
enfoque est basado en la construccin de modelos
en dos y tres dimensiones. Para ambos casos, se
determinan en forma robusta puntos de control que
identifican posiciones especficas del rostro. Estos
puntos construyen una estructura topolgica
utilizando la posicin de los ojos, nariz, labios, etc.
Luego, se genera iterativamente una alineacin y
superposicin sobre el rostro hasta deformar la
estructura no rgida (Lu & Jain, 2005).
Lamentablemente esta tcnica es muy lenta y
requiere la estimacin de puntos de control precisos,
por lo tanto, la imagen debe estar en una alta calidad.
Adems, debido al proceso iterativo, puede quedar
atrapada en ptimos locales siendo dependiente de la
posicin de los puntos de control inicialmente
seleccionados (Lu, 2003).
Los distintos algoritmos de reconocimiento e
identificacin del rostro dependen del dominio donde
sea aplicado (Yang et al., 2002). No existe un
sistema que sea complemente eficaz en todas las
condiciones, por este motivo, nuestra investigacin
se limita a desarrollar una tcnica de identificacin
considerando fija la posicin del rostro y nica en la
imagen.
2.2 Sistema de reconocimiento por voz
El reconocimiento de la voz es el proceso de
reconocer automticamente quin est hablando
utilizando la informacin dada por las ondas de
sonido emitidas (Furui, 1981; Doddington, 1985).
En general, los sistemas de reconocimiento de voz
tiene dos mdulos principales: extraccin de
caractersticas y comparacin de caractersticas. La
extraccin de caractersticas es el proceso por el cual
extraemos una pequea cantidad de datos de la seal
de voz que puede ser usada para representar a cada
persona. La comparacin de caractersticas involucra
el proceso de identificar a la persona desconocida
comparando las caractersticas extradas de su voz,
con las previamente obtenidas, que corresponden a
las personas conocidas por sistema.
La voz es una seal que vara lentamente en relacin
al tiempo. Cuando examinamos por un perodo
Proceso de Identificacin
Input de Rostro
Extraccin de
caractersticas de
Rostros (eigenfaces)
Vector de Caractersticas
1
PCA
Branch
& Bound
Seleccin de
Caractersticas de
Audio y Rostro
BD
Fusin de
Clasificadores
Input de Audio
Extraccin de
caractersticas de
Audio (MFCC)
Obtencin
de Informacin
Extraccin de
Caractersticas
Identidad
reconocida
Seleccin de
Caractersticas
Clasificacin
15
Fig. 2. BD de imgenes compuesta por 15 individuos con siete diferentes expresiones faciales o configuracin con lentes,
sorprendido, gesticulando, sonriente, normal, triste o dormido (McDermott, 2006).
4. EXPERIMENTOS Y RESULTADOS
Nuestra fase experimental fue dividida en tres
anlisis independientes. Primero, se seleccionaron las
diez mejores caractersticas del audio; Segundo se
seleccionaron las diez mejores caractersticas del
rostro; y Tercero, se seleccionan las cinco mejores
caractersticas del audio y del rostro, para luego
combinarlas en una nica BD con un total de diez
caractersticas. Estas ltimas no necesariamente
pertenecen a los datos contenidos en las dos primeras
bases de datos. El propsito de esta separacin, es
medir el rendimiento individual de cada una de estas
medidas biomtricas, y su anlisis combinado.
En la fase de clasificacin se utilizaron los cinco
clasificadores en forma independiente para
determinar el rendimiento individual. Luego se
utiliz el mtodo Stacking y Vote, descrito
anteriormente, para determinar si existen cambios en
el rendimiento con las tcnicas de fusin. Para
evaluar el rendimiento de los clasificadores, se
emple el mtodo de seleccin de datos k-cross
validation (Mitchel, 1997). En particular, utilizamos
este algoritmo con k=10 (Fig. 3).
Inicialmente se evalu el rendimiento individual de
los cinco clasificadores del estudio (NB, BN, RN, kNN y J4.8) (ver Tabla 1). Posteriormente se
generaron dos grupos de fusin. El primero utiliza
cinco clasificadores mencionados anteriormente; el
segundo slo utiliza los clasificadores NB, k-NN y
J4.8. (ver Tabla 2).
BD1
Audio
BD2
Rostro
BD3
A+R
Stacking
Vote
10Cross
Validation
NB, k-NN,
J4.8
Naive
Bayes
99.1
88.5
98.1
Bayes
Net
91.5
84.8
84.7
Neural
Net
100
90.4
100
k-NN
(5)
97.2
88.6
88.6
Tree
J4.8
81.7
84.5
84.5
Grupos de
fusin
Mtodo
BD1.Audio
BD2. Rostro
BD3. A+R
RN+BN+NB
k-NN (5) +J4.8
Stacking
Vote
98.1
100
87.5
92.3
98.1
99
NB+k-NN (5)
+J4.8
Stacking
Vote
98.1
99.1
90.4
92.3
99
99
Stacking
Vote
5. CONCLUSIONES
Esta investigacin presenta el desarrollo de la
metodologa de reconocimiento de patrones aplicado
al reconocimiento biomtrico de audio y rostro. Los
resultados demuestran que un sistema biomtrico de
audio y rostro es viable, principalmente porque los