Está en la página 1de 7

1

ESTIMACIN DE EDAD A PARTIR DE IMGENES FACIALES: BASADO EN


REDES NEURONALES
Edgar Osavaldo Muoz Abad

Edgar.munoza@ucuenca.ec

ResumenEste artculo presenta el diseo, desarrollo e implementacin de un sistema de reconocimiento facial mediante la
unin de tcnicas de deteccin y reconocimiento de rostros. En el transcurso del proyecto se analiza el algoritmo de Viola-
jones para la deteccin de rostros y posteriormente tambin se hace un anlisis de la factibilidad de utilizar el reconocimiento
de caras basadas en la proyeccin de las imgenes en diferentes subespacios (PCA) con el objetivo de minimizar el nmero
de entradas a nuestra red neuronal.

ndice De TrminosAlgoritmo, covarianza, eigen-vector, funcin de activacin, pixel, proyeccin.

1 INTRODUCCIN

E n este artculo se describir un sistema de visin


artificial que realiza las tareas de identificacin y re-
conocimiento facial mediante una red neuronal. Para
Adems de los cambios causados por el crecimiento crneo-
facial, se producen cambios menores en la piel [1], como:
cambios en el color de la piel.y Aparicin de bello facial.
realizar las tareas anteriores se utilizan tcnicas de identi-
ficacin de rostros basadas en Viola-Jones y proyecciones La segunda fase del envejecimiento facial, es en la edad
de espacios vectoriales para reducir lo ms que se pueda adulta. La edad adulta se define como el tiempo desde el
el espacio de estados y as entrenar nuestra red neuronal final del crecimiento hasta la vejez. Los principales cambios
multicapa con funcin de activacin tipo sigmoidal lo en esta etapa son los cambios en la textura de la piel. La piel
ms eficientemente posible. se vuelve ms delgada, ms oscura, menos elstica y ms
correosa. Adems, las arrugas, las mejillas hundidas y bolsas
En la Figura 1 se muestra un esquema del algoritmo de bajo los ojos aparecen.
visin completo. En los siguientes apartados se desarro-
llaran cada una de las etapas propuestas en el esquema
anterior. 2.3 estimacin de la edad

La edad se puede determinar de muchas maneras pero


2 CARACTERISTICAS FACIALES en este trabajo se refiere a la estimacin de la edad sobre
imgenes bidimensionales de rostros humanos.
2.1 Introduccin hay varios tipos de edad [1]:
La edad cronolgica se define como el nmero de aos
Las personas tienen ciertas carateriscas faciales de- que una persona ha vivido.
pendiendo de la edad, estas carateristas segn los estu- Apariencia es la informacin acerca de la edad, definida
dios realizados[2]; varian segn la edad de la persona, por la apariencia de una persona.
tales carateristicas son distancias entre los elementos que La edad percibida se define por la respuesta de otras
componen el rostro. personas que se basan sobre la apariencia de una persona.
La edad estimada definida por un ordenador basada en
2.2 caracteristicas faciales comunes segn la edad la apariencia de las personas.
El objetivo de la estimacin de la edad, es que la edad
El comportamiento de las caractersticas faciales pue- resultante, sea lo ms cercano posible a la edad real o
de deteterminar dos etapas del envejecimiento facial. La cronolgica de una persona.
primera fase, los primeros aos, que se define como el
tiempo transcurrido, desde el nacimiento hasta la edad 2.4 modelo de representacin facial
adulta. En esta etapa, la mayora de los cambios se deben
a el crecimiento crneo-facial [1]. En la figura 1 se puede Existen cinco diferentes enfoques que se utilizan, co-
observar comportamiento mo modelos para la representacin facial en este trabajo
se utilizara el siguiente:
Modelo activo de apariencia:
Son ampliamente utilizados como una caracterstica para
la estimacin de edad. Su objetivo es obtener una aproxi-
macin de la edad e implementar simulaciones para reco-
figura 1.-Comportamiento craneo-facial en la priemra fase lectar los cambios de la apariencia con el paso del tiempo.
2

La antropometra facial, es la ciencia de medir el tamao


y las proporciones de un rostro humano y la textura, este
modelo no est orientado slo a las personas ms jvenes,
pero se ocupa de la evaluacin de la edad de las personas
de todas las edades. Mediante este modelo la edad de una
persona puede ser estimado con mayor precisin [3]. En
la figura se presenta los puntos de interes que determina
el modelo

figura 3.-Deteccion de las Areas de interes

3.3 Calculo de proporciones de los puntos de interes

Los puntos de interes que indica el modelo activo son


los siguientes: pupilas, centro de la nariz, punto medio
entre los ojos, punto medio de la boca, mentn, frente,
ancho de rostro.
figura 2.- Puntos de interes para las mediociones geomtri-
cas del modelo. El propsito de la determinacin de los puntos de interes
es el clculo de proporciones o razones entre diversas
distancias del rostro humano, es decir, realizar un anlisis
antropomtrico del cual se pueda realizar una aproxima-
3 DETECCIN DE PUNTOS DE INTERS
cin de la edad del individuo [5]. Las Razones que pro-
veen mayor informacin sobre la caracterisca crneo-
3.1 Introduccin facial son[6]:

Los areas de interes que son el rostro, ojos, nariz, boca.


Estos sern los parmetros con los cuales se determinaran
la edad, para la deteccin de estos areas se utilizan mode-
los muy conocidos y que proveen una deteccin muy
buena. Una vez detectada las reas se procede a seleccio-
nar los puntos de interes, y luego se calcula las propor-
ciones de del rostro

3.2 Deteccin de reas de interes basado en Viola-Jones

Este algoritmo realiza la representacin de las imge-


nes mediante el mtodo de la imagen integral; esto permi-
te evaluar de forma muy rpida las caractersticas
utilizadas. Entonces no es utilizado la intensidad de la figura 4.-razones para determinar caracteristicas craneo-facial
imagen, sino con una representacin de la misma. La gran
ventaja es que se pueden calcular las caractersticas
1 =
utilizadas en cualquier lugar de la imagen y en cual-
quier escala en el mismo lapso de tiempo y en forma

sumamente eficiente desde el punto de vista del gasto 2 =

computacional . [4]
mediante este mtodo se logra detectar elas reas de
interes que son el rostro, los ojos, la nariz, la boca. Este
3 =
algoritmo provee estas reas. En la siguiente imagen se
muestra las reas que se obtieen mediante este mtodo.

4 =


5 =


6 =

3


7 =
4.2.1 Pre-procesamiento
Lo siguiente que se hiso fue transformar las imgenes
3 =
en escala de grises dado que si estuviera en formato RGB
se necesitara 3 matrices para interpretar las tonalidades
de las mismas. A continuacin se procede a representar
3.4 Seleccin de reas de texturas de la piel cada imagen en un solo vector, pero dado que dichas
imgenes tienen resolucin de 64x48 pixeles se debe im-
El modelo de representacin facial que se utilza requie- plementar una red neuronal con 3072 entradas para ava-
re una carateriztica dada por la textura de la piel, esta luar cada imagen, esto es computacionalmente y tempo-
carateristica sern las arrugas en las zonas de: La frente, ralmente ineficiente, por lo cual se recurre a otra alterna-
bajo los ojos tiva, que consiste en extraer solamente los valores caracte-
rsticos del conjunto de imgenes mediante eigen-vectores
con el objetivo de reducir el nmero de entraras de la red
4 METODOLOGA neuronal.

4.2.2 Procesamiento
Figura1. Diagrama de bloques del sistema [2].

La extraccin de las caractersticas importantes se lo


realiza de la siguiente forma:
4.1 Adquisicin de imgenes
1. Se calcula la media de cada rostro.
La toma de estos datos se los puede introducir median- 2. Se hace un clculo estadstico de la covarianza.
te la cmara o manualmente. En el caso de que se desea 3. Se extrae los eigen-vectores.
reconocer los rostros en tiempo real, se debe hacer uso de 4. Se proyecta los eigen-vectores con la covarianza, este
frames, lo cual es capturar imgenes de la cmara cada resultado proporciona los componentes ms importan-
cierto tiempo. Para cada captura se debe hacer el recono- tes de cada rostro.
cimiento del rostro, mostrar el nombre de la persona
identificada en la pantalla y seguir con la siguiente cap- De acuerdo al proceso descrito anteriormente se res-
tura, por este motivo es que la toma de datos (imgenes) tringe el nmero de eigen-vectores evaluando los elemen-
no es muy seguida, dado que requiere ciertos procesos en tos ms relevantes. Por ejemplo vemos que en la Figura 3
medio. se muestra la proyeccin de los vectores con 17 elemen-
tos, pero se nota que los ltimos 13 elementos de las co-
4.2 Entrenamiento de la red neuronal lumnas son muy cercanos a cero, por este motivo para la
implementacin de la red neuronal solo se consideran los
Lo primero a tener en cuenta son los elementos con los 4 primeros elementos de los eigen-vectores:
cuales se va a entrenar la red, ya que de esto depende su
desempeo. A continuacin se muestra los rostros que se
utiliz para el entrenamiento en este trabajo:

Figura3. Proyeccin utilizando 17 elementos de los eigen-vectores.

Tambin se puede notar que algunos elementos de la


Figura2. Rostros para el entrenamiento de la red neuronal.
4

proyeccin son mayores a uno en valor absoluto, pero


tenemos un inconveniente, la red neuronal trabaja con De la imagen adquirida previamente en el punto 4.1 se
valores comprendidos entre [-1,1] dado que se utiliza una procede a detectar el rostro mediante el algoritmo de
funcin de activacin sigmoide tangencial, por lo tanto, Viola-Jones (este algoritmo ya es una funcin implemen-
tenemos que normalizar estos vectores. La frmula ma- tada en matlab), se recorta el rea del rostro y se cambia de
temtica que se utiliza para la normalizacin es la si- tamao (64x48 pixeles).
guiente:
4.3.2 Procesamiento

= + ( + )
Se transforma el rostro a escala de grises, se hace un
Donde: solo vector de pixeles, se proyecta con los eigen-vectores
hallados en el punto 5.2 y se normaliza los datos.
=
=
4.3.3 Red neuronal
=
=
Como paso final se introduce los datos resultantes de
=
la normalizacin en la red neuronal y se interpreta la
=
salida.

Valores del vector de salida en donde tenga un mxi-


mo valor en la ltima posicin corresponde a la persona
uno, valores del vector de salidas en donde tenga un m-
ximo valor en la posicin tres corresponde a la persona
dos y valores del vector de salidas en donde tenga un
Figura4. Datos normalizados.
mximo valor en la posicin uno corresponde a la perso-
na tres.
4.2.3 Red neuronal
000011
Una vez que se tiene las entradas listas para entrenar la 000000
red neuronal, se necesita saber qu tipo de red se va a = 0 0 1 1 0 0
implementar. Se plantea una red con diez neuronas en la 000000
capa oculta, con un factor de aprendizaje =0.5 y 100 ( 1 1 0 0 0 0)
iteraciones (se observa a continuacin).
4.3.4 Visualizacin

En la pantalla se visualiza la imagen completa ingresa-


da con anterioridad, pero adems se grafica un rectngulo
alrededor del rostro con su posible identificacin.

Figura6. Visualizacin en pantalla de una persona al ser reconocida.

Figura5. Estructura de la red neuronal. 5 RESULTADOS


4.3 Reconocimiento facial
Se prueba la red neuronal con otras expresiones facia-
les y en escenarios distintos de los sujetos puestos a prue-
4.3.1 Pre-procesamiento
5

ba:

Figura9. Visualizacin en pantalla de la persona dos al ser reconocida


con diferente expresin facial y diferente tonalidad.

Para los resultados logrados se emplearon los siguien-


tes parmetros:

Tabla1. Caractersticas de la red neuronal.


Caractersticas de la red neuro-
nal
Numero de neuronas en 10
la capa oculta
Factor de aprendizaje 0.5
Umbral de error 0.01
Numero de iteraciones 100

Y se tiene la siguiente curva de error:

Figura7. Visualizacin en pantalla de la persona tres al ser recono-


cida con diferente expresin facial.

Figura10. Grafica del error con los parmetros de la tabla 1.


Figura8. Visualizacin en pantalla de la persona uno al ser recono-
cida con diferente expresin facial y diferente escenario. Ahora se va a cambiar los parmetros, como se ve en la
tabla 2.

Tabla2. Caractersticas de la red neuronal.


Caractersticas de la red neuro-
nal
Numero de neuronas en 10
la capa oculta
Factor de aprendizaje 0.1
Umbral de error 0.1
6

Numero de iteraciones 200 6 DISCUSIN


Este trabajo est orientado a la identificacin de rostros
Lo primero en tener en cuenta es la grfica del error, lo de posicin frontal ya que el algoritmo que se usa para la
que se nota es que antes que se cumpla en nmero de deteccin de rostros no es capaz de calcular la orientacin
iteraciones se alcanz el umbral de error. Por lo tanto, se de la cara. Adems cuando se hace el reconocimiento
detiene el entrenamiento aproximadamente en la itera- facial en tiempo real, el acertado o errneo resultado de la
cin 105. red neuronal depende en gran medida del brillo con el
cual las imgenes son capturadas, ya que el entrenamien-
Tambin cambiamos el factor de aprendizaje a =0.1, to de la red neuronal con el conjunto de imgenes de
esto quiere decir que se va a tener saltos ms pequeos entrenamiento tiene cierto lmite de certeza.
cando se minimiza el error mediante el descenso del gra-
diente. Un parmetro fundamental de este trabajo es la cova-
rianza, el cual depende del nmero de elementos de en-
trenamiento, se procura en lo posible que los individuos
puestos a prueba en este trabajo sean lo ms diferentes
para que dicha covarianza tome valores mximos y por lo
tanto, tener mayor certeza en los resultados de la red
neuronal.

7 REFERENCIAS
[1] Lerma, J. (2009). Implementacin del algoritmo de deteccin facial de
Viola-Jones. [online] Academia.edu. Available at:
https://www.academia.edu/9503665/Implementacion_del_algoritmo_d
e_deteccion_facial_de_Viola-
Jones_Autor_Joaqu_%C4%B1n_Planells_Lerma_Director [Accessed
2 Jan. 2017].

[2] Romero, K. and Gamboa, H. (2007). Reconocimiento de rostros


Figura11. Grafica del error con los parmetros de la tabla 2.
utilizando una red neuronal. 1st ed. [ebook] Quito, pp.8-20. Available
at: http://es.slideshare.net/hbanda/reconocimiento-de-rostros-
Pero con estas nuevas caractersticas de la red neuronal utilizando-una-red-neuronal [Accessed 2 Jan. 2017].
se produce ciertos errores de deteccin, como por ejem-
[3] Paz, N. (2009). Introduccin al reconocimiento de patrones. 1st ed.
plo, al sujeto dos la red neuronal le reconoce como el [ebook] pp.18-25. Available at:
sujeto uno, como se en la figura 12. https://eva.fing.edu.uy/file.php/514/ARCHIVO/2008/TrabajosFinales
2008/NestorPaz2008_informe.pdf [Accessed 2 Jan. 2017].

[4] Serbanbiometrics.es. (n.d.). Reconocimiento facial. [Online] Available


at: http://www.serbanbiometrics.es/es/soluciones/reconocimiento-
facial [Accessed 2 Jan. 2017].

[5] Aplicacin de los diferentes espacios de color para deteccin y segui-


miento de caras. (n.d.). 1st ed. [ebook] Alicante, pp.1-4. Available at:
http://lcsi.umh.es/docs/papers/2003_espaciosdecolor.pdf [Accessed 2
Jan. 2017].

1 geng ijk
2 saravi aijk
3=[11] memoria
[4] Viola, P., &Jones, M. J. (2004). Robust real-
time face detection. International journal of com-
puter vision, 57(2), 137-154.
5=[9] memoria
[6] Kwon, Y. H., & da Vitoria Lobo, N. (1999).
Age classification from facial images. Computer
Figura12. Visualizacin en pantalla de la persona dos al ser recono- Vision and Image Understanding, 74(1), 1-21.
cida como errnea.

Entonces, se podra decir que para un factor de apren-


dizaje no muy bajo y un umbral de error inferior al 1% se
encuentran los mejores resultados para este proyecto.
7

También podría gustarte