Está en la página 1de 125

UNIVERSIDAD MAYOR

FACULTAD DE INGENIERIA

RECONOCIMIENTO DE ROSTROS HUMANOS


BASADO EN UNA RED NEURONAL
DE RETROPROPAGACION
Proyecto de Ttulo para Optar al Ttulo
de Ingeniero Civil Electrnico

FRANCISCO GONZALO CACERES BASCUAN

SANTIAGO DE CHILE
JULIO-2002

UNIVERSIDAD MAYOR
FACULTAD DE INGENIERIA

RECONOCIMIENTO DE ROSTROS HUMANOS


BASADO EN UNA RED NEURONAL
DE RETROPROPAGACION
Proyecto de Ttulo para Optar al Ttulo
de Ingeniero Civil Electrnico

Alumno
: Francisco Gonzalo Cceres Bascun
Profesor Gua : Claudio Andrs Prez Flores, Ph.D.
Ingeniero Civil Elctrico
Ph.D. in Biomedical Engineering

SANTIAGO DE CHILE
JULIO 2002
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Como dediqu el Proyecto de Licenciatura a mi


madre, con todo mi amor dedico este Proyecto a mi
padre, quien siempre me incentiv el estudio terico.
Nunca olvidar que l deca: Con la matemtica se
podrn
desarrollar
sistemas
dinmicos
inimaginables, que permitirn el progreso de la
ciencia y de la humanidad.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

AGRADECIMIENTOS
Deseo agradecer a mis padres por la profunda formacin humana y el apoyo incondicional que
me entregaron desde mi niez. Pap, gracias por haber sido padre y madre durante estos
ltimos 9 aos y por todo el apoyo que da a da me entregaste. De igual forma, gracias Sra.
Ana Luisa Soto, quien me ha cuidado como una madre desde que est con nosotros. Muchas
gracias, Claudia Rodrguez, amor mo, por el apoyo que me has brindado en los momentos
ms difciles de mi vida, por tu comprensin y por el amor que me entregas da a da. Y por
supuesto a tu familia, quines siempre han estado cerca de m.
Deseo agradecer a mi profesor gua Sr. Claudio A. Prez Flores, por todas sus sugerencias que
influyeron considerablemente en mis proyectos y, por sobre todo, en mi persona. Y por haber
tenido el honor de ser su discpulo.
Deseo agradecer, expresamente, a mis amigos: Enrique Alvarado, Adrin Barahona, Ren
Cornejo, Hugo Corts (Q.E.P.D.) y Gabriela Matus, quienes sabiamente me han guiado en la
vida. Gracias, tambin, a Juan Pablo Aguirre, Rodrigo Barros, Christian Larran, Nelson Rojas
y Don Ivn Velasco quienes siempre me apoyaron de distintas maneras. Tambin deseo
agradecer, al personal de biblioteca: Loreto Aldunate, Ana Landry y Carmen Gloria Resener,
quienes siempre me facilitaron la bsqueda de libros e informacin. A la Dra. M. Alejandra
Armijo, quien me ayud de forma invaluable en la recuperacin de mi salud. A mis profesores
universitarios: Carlos Beyzaga, Luis Briceo, Guillermo Cceres, Andrs Carrillo, Mario
Flores, Juan Guadalupe, Patricio Gonzlez, Collete Hollemart, Heliodoro Rojas, Carlos
Romero, Dagoberto Ramos, Hernn Sanhueza y Gonzalo Tllez, a todos ellos muchas gracias,
por haber participado en mi formacin profesional. Deseo, adems, agradecer al Decano Dr.
Carlos Martnez y al Sr. Luis Solar, por haberme confiado los cargos de profesor auxiliar, en
los cursos de Clculo I, II, III, IV y Algebra I, II, III, cuando era estudiante.
Quiero agradecer, tambin, a ciertas personas que nunca conoc personalmente, pero que
desde mi niez influenciaron en m, la bsqueda del progreso de la humanidad, de la ciencia y
las artes. A estas personas, a quienes admiro profundamente, que me deslumbraron con sus
trabajos y que no puedo dejar de mencionar son: Isaac Asimov, Charles Chaplin, Ricci y Levi
Civita, Albert Einstein, George Lucas, Amadeus Mozart, Carl Sagan e Igor Stravinsky.
Finalmente, lamento no poder dar las gracias a ciertas personas a quienes hubiese deseado
agradecer, pero no puedo...

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

INDICE
INDICE........................................................................................................................................5
RESUMEN ................................................................................................................................15
ABSTRACT ..............................................................................................................................17
CAPITULO I - INTRODUCCION .........................................................................................18
1.1 IMPORTANCIA DEL RECONOCIMIENTO DE ROSTROS HUMANOS .......................18
1.2 OBJETIVOS .........................................................................................................................19
1.2.1 Objetivo General...........................................................................................................19
1.2.1 Objetivo Especifico.......................................................................................................19
1.3 ANTECEDENTES DE INVESTIGACIONES PREVIAS ...................................................20
CAPITULO II - MODELO DE LA RED NEURONAL DE RETROPROPAGACION ...23
2.1 INTRODUCCION ................................................................................................................23
2.2 PERCEPTRON.....................................................................................................................23
2.2.1 Introduccin ..................................................................................................................23
2.2.2 Arquitectura ..................................................................................................................24
2.2.3 Funcionamiento ............................................................................................................24
2.2.4 Aprendizaje...................................................................................................................25
2.3 PERCEPTRON MULTICAPAS ..........................................................................................27
2.3.1 Arquitectura ..................................................................................................................27
2.3.2 Funcionamiento ............................................................................................................28
2.3.3 Aprendizaje...................................................................................................................29
2.4 RETROPROPAGACION (BACKPROPAGATION) ..........................................................29
2.4.1 Introduccin ..................................................................................................................29
2.4.2 Arquitectura ..................................................................................................................29
2.4.3 Funcionamiento ............................................................................................................30
2.4.4 Aprendizaje (Regla delta generalizada)........................................................................30

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

CAPITULO III - IMPLEMENTACION COMPUTACIONAL DE LA RED


NEURONAL DE RETROPROPAGACION .........................................................................38
3.1 INTRODUCCION ................................................................................................................38
3.2 CODIFICACION DE LA NEURONA ARTIFICIAL ..........................................................38
3.3 MODELACION Y CODIFICACION DE LA ARQUITECTURA .....................................39
3.4 CODIFICACION DE LA PROPAGACION HACIA DELANTE........................................44
3.5 CODIFICACION DE LA PROPAGACION HACIA ATRAS.............................................45
3.6 CODIFICACION PARA LA MODIFICACION DE PESOS...............................................46
3.7 CODIFICACION DEL APRENDIZAJE..............................................................................48
3.8 CODIFICACION PARA CALCULAR LAS TASAS DE RECONOCIMIENTO Y
ERRORES CUADRATICOS MEDIOS.....................................................................................50
CAPITULO IV - METODOLOGIA PARA EL DESARROLLO DE UN SISTEMA DE
RECONOCIMIENTO DE ROSTROS HUMANOS BASADO EN UNA RED
NEURONAL .............................................................................................................................52
4.1 INTRODUCCION ................................................................................................................52
4.2 SISTEMA DE RECONOCIMIENTO AUTOMATICO DE ROSTROS..............................52
4.2.1 Hardware para la implementacin del sistema de reconocimiento...............................52
4.2.2 Etapas del sistema de reconocimiento automtico de rostros humanos .......................54
4.3 BASE DE DATOS DE ROSTROS HUMANOS ..................................................................55
4.3.1 Introduccin ..................................................................................................................55
4.3.2 Conversin en el formato de las imgenes ...................................................................57
4.3.3 Particiones realizadas en la base de datos ORL............................................................59
4.4 REDUCCION PIRAMIDAL ................................................................................................62
4.5 ESTIRAMIENTO LINEAL DE CONTRASTE ...................................................................64
4.6 APRENDIZAJES DE LA RED NEURONAL VARIANDO EL TAMAO DE LAS
IMAGENES Y LA CANTIDAD DE NEURONAS OCULTAS ................................................67
4.6.1 Introduccin ..................................................................................................................67
4.6.2 Forma de realizacin de las muestras ...........................................................................67
CAPITULO V - RESULTADOS.............................................................................................72
5.1 INTRODUCCION ................................................................................................................72

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

5.2 MUESTRAS DE APRENDIZAJES DE LA RED NEURONAL VARIANDO EL


TAMAO DE LAS IMAGENES Y LA CANTIDAD DE NEURONAS OCULTAS CON LA
PRIMERA PARTICION ............................................................................................................73
5.3 RESULTADOS PROMEDIOS DE RECONOCIMIENTOS DE ROSTROS HUMANOS
PARA DIFERENTES RESOLUCIONES DE LAS IMAGENES DE ENTRADA Y DE LA
CANTIDAD DE NEURONAS OCULTAS CON LA PRIMERA PARTICION .......................79
5.6 RESULTADOS DE LOS EXPERIMENTOS CON LA SEGUNDA PARTICION .............94
CAPITULO VII - CONCLUSIONES...................................................................................102
BIBLIOGRAFIA ....................................................................................................................106

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

INDICE DE FIGURAS
FIGURAS
Figura 1.
Figura 2.
Figura 3.
Figura 4.

Figura 5.
Figura 6.
Figura 7.
Figura 8.
Figura 9.

Figura 10.

Figura 11.

Figura 12.

Figura 13.

Figura 14.

Pgina
Arquitectura de la red neuronal Perceptron con (n)-neuronas de
entradas y una neurona de salida (Nj).
Arquitectura de una red neuronal Perceptron Multicapas con
propagacin hacia adelante
Arquitectura de una red neuronal de Retropropagacin basado
en un Perceptron Multicapas
Modelacin computacional, mediante estructura de datos, de la
arquitectura de la red neuronal de retropropagacin de la Figura
3
Simplificacin, en la estructura de datos, del modelo
computacional
Requerimientos de hardware para el sistema de reconocimiento
automtico
Etapas del sistema de reconocimiento automtico
Imgenes de los rostros humanos de la base de datos ORL
Imgenes de entrenamiento de la primera y cuarta persona
respectivamente de la base de datos ORL, de la primera
particin
Imgenes de prueba de la primera y cuarta persona
respectivamente de la base de datos ORL, de la primera
particin
Imgenes de entrenamiento de la primera y cuarta persona
respectivamente de la base de datos ORL, de la segunda
particin
Imgenes de validacin de la primera y cuarta persona
respectivamente de la base de datos ORL, de la segunda
particin
Imgenes de prueba de la primera y cuarta persona
respectivamente de la base de datos ORL, de la segunda
particin
Efectos de la reduccin piramidal. (A) Muestra el efecto terico
en la reduccin de los pxeles. (B) Muestra el efecto directo en
una imagen de la base de datos ORL

24
27
30
41

43
53
54
56
60

60

61

61

61

63

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Figura 15. Estiramiento lineal de contraste (ELC) en imgenes. (A) Imagen


sin ELC. (B) Imagen con ELC

66

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

INDICE DE GRAFICOS
GRAFICOS
Grfico 1.
Grfico 2.

Grfico 3.

Grfico 4.

Grfico 5.

Grfico 6.

Grfico 7.

Grfico 8.

Grfico 9.

Grfico 10.

Pgina
Representacin del estiramiento lineal aplicado a cada pxel de
una imagen
Estiramiento lineal de contraste (ELC) en histogramas (H). (a)
H. de la Figura 15(a) sin ELC, medido en nmero de
pxeles/total en funcin de los niveles de gris. (b) H. de la
Figura 15(b), con ELC
Tasa media de reconocimiento con sus respectivas
desviaciones en funcin de cantidad de neuronas ocultas, para
una red neuronal con imagen de entrada de 92x112 pxeles
Promedio del error cuadrtico medio con sus respectivas
desviaciones en funcin de la cantidad de neuronas ocultas,
para una red neuronal con imagen de entrada de 92x112
pxeles
Tasa media de reconocimiento con sus respectivas
desviaciones en funcin de cantidad de neuronas ocultas, para
una red neuronal con imagen de entrada de 46x56 pxeles
Promedio del error cuadrtico medio con sus respectivas
desviaciones en funcin de la cantidad de neuronas ocultas,
para una red neuronal con imagen de entrada de 46x56 pxeles
Tasa media de reconocimiento con sus respectivas
desviaciones en funcin de cantidad de neuronas ocultas, para
una red neuronal con imagen de entrada de 23x28 pxeles
Promedio del error cuadrtico medio con sus respectivas
desviaciones en funcin de la cantidad de neuronas ocultas,
para una red neuronal con imagen de entrada de 23x28 pxeles
Tasa media de reconocimiento con sus respectivas
desviaciones en funcin de cantidad de neuronas ocultas, para
una red neuronal con imagen de entrada de 11x14 pxeles
Promedio del error cuadrtico medio con sus respectivas
desviaciones en funcin de la cantidad de neuronas ocultas,
para una red neuronal con imagen de entrada de 11x14 pxeles

66
67

80

80

81

82

83

83

84

85

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

10

Grfico 11.

Grfico 12.

Grfico 13.

Grfico 14.

Grfico 15.

Grfico 16.

Grfico 17.

Grfico 18.

Grfico 19.

Grfico 20.

Grfico 21.

Grfico 22.

Tasa media de reconocimiento con sus respectivas


desviaciones en funcin de cantidad de neuronas ocultas, para
una red neuronal con imagen de entrada de 5x7 pxeles
Promedio del error cuadrtico medio con sus respectivas
desviaciones en funcin de la cantidad de neuronas ocultas,
para una red neuronal con imagen de entrada de 5x7 pxeles
Tasas de reconocimientos, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
92x112 pxeles
Errores cuadrticos medios, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
92x112 pxeles
Tasas de reconocimientos, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
46x56 pxeles
Errores cuadrticos medios, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
46x46 pxeles
Tasas de reconocimientos, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
23x28 pxeles
Errores cuadrticos medios, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
23x28 pxeles
Tasas de reconocimientos, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
11x14 pxeles
Errores cuadrticos medios, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
11x14 pxeles
Tasas de reconocimientos, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
5x7 pxeles
Errores cuadrticos medios, en porcentaje, en funcin del
nmero de pocas, para la segunda particin, con imgenes de
5x7 pxeles

86

86

97

97

98

98

99

99

100

100

101

101

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

11

INDICE DE TABLAS
TABLAS
Tabla 1.
Tabla 2.
Tabla 3.
Tabla 4.
Tabla 5.

Tabla 6.

Tabla 7.

Tabla 8.

Tabla 9.

Tabla 10.

Pgina
Posibles regiones de decisin con diferentes nmeros de capas y
de neuronas con una red neuronal tipo Perceptron Multicapa
Reduccin piramidal de las imgenes en pxeles y del tamao del
vector de entrada a la red neuronal
Comparaciones entre redes neuronales con diferente cantidad de
neuronas ocultas. Compara (1). No compara (0)
Comparaciones entre redes neuronales con diferentes
arquitecturas. Compara (1) y no compara (0)
Entrenamientos de la red neuronal variando el nmero de
neuronas ocultas (NH). Imgenes de 92x112 pxeles. Se
presentan las tasas de reconocimientos (TR) y los errores
cuadrticos medios (ECM).
Entrenamientos de la red neuronal variando el nmero de
neuronas ocultas (NH). Imgenes de 46x56 pxeles. Se presentan
las tasas de reconocimientos (TR) y los errores cuadrticos
medios (ECM).
Entrenamientos de la red neuronal variando el nmero de
neuronas ocultas (NH). Imgenes de 23x28 pxeles. Se presentan
las tasas de reconocimientos (TR) y los errores cuadrticos
medios (ECM).
Entrenamientos de la red neuronal variando el nmero de
neuronas ocultas (NH). Imgenes de 11x14 pxeles. Se presentan
las tasas de reconocimientos (TR) y los errores cuadrticos
medios (ECM).
Entrenamientos de la red neuronal variando el nmero de
neuronas ocultas (NH). Imgenes de 5x7 pxeles. Se presentan
las tasas de reconocimientos (TR) y los errores cuadrticos
medios (ECM).
Tasa media de reconocimiento (TMR) y promedios de los errores
cuadrticos medios (PECM) con sus respectivas desviaciones, en
el conjunto de prueba, de la Tabla 5. Imgenes de 92x112 pxeles

28
63
69
70
74

75

76

77

78

79

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

12

Tabla 11.

Tabla 12.

Tabla 13.

Tabla 14.

Tabla 15.

Tabla 16.

Tabla 17.

Tabla 18.

Tabla 19.

Tabla 20.

Tabla 21.

Tasa media de reconocimiento (TMR) y promedios de los errores


cuadrticos medios (PECM) con sus respectivas desviaciones, en
el conjunto de prueba, de la Tabla 6. Imgenes de 46x56 pxeles
Tasa media de reconocimiento (TMR) y promedios de los errores
cuadrticos medios (PECM) con sus respectivas desviaciones, en
el conjunto de prueba, de la Tabla 7. Imgenes de 23x28 pxeles
Tasa media de reconocimiento (TMR) y promedios de los errores
cuadrticos medios (PECM) con sus respectivas desviaciones, en
el conjunto de prueba, de la Tabla 8. Imgenes de 11x14 pxeles
Tasa media de reconocimiento (TMR) y promedios de los errores
cuadrticos medios (PECM) con sus respectivas desviaciones, en
el conjunto de prueba, de la Tabla 9. Imgenes de 5x7 pxeles
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
imgenes de 92x112 pxeles
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
imgenes de 46x56 pxeles
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
imgenes de 23x28 pxeles
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
imgenes de 11x14 pxeles
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
imgenes de 5x7 pxeles
Mejores arquitecturas de la red neuronal para cada resolucin
piramidal analizada. Se muestran las tasas de reconocimiento
(TMR) y el promedio de los errores cuadrticos medios (PECM),
con sus respectivas desviaciones estndares
Diferentes arquitecturas de la red neuronal con respecto a la
cantidad de neuronas ocultas (NH) sometidas a Test, para
diferentes resoluciones de imgenes

81

82

84

85

87

88

89

90

91

92

93

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

13

Tabla 22.

Tabla 23.

Resultados entrenamientos de la red neuronal con la segunda


particin slo para las mejores arquitecturas. Se muestra la mejor
tasa de reconocimiento (TR) con su respectivo error cuadrtico
medio (ECM), seleccionado en el conjunto de validacin. Idem
para entrenamiento y prueba
Resultados medios de reconocimiento con la segunda particin.
Se muestran las tasas medias de reconocimiento (TMR) y el
promedio de los errores cuadrticos medios (PECM), con sus
respectivas desviaciones estndares (Ver Tabla 22)

95

96

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

14

RESUMEN
El Proyecto Reconocimiento de Rostros Humanos Basado en una Red Neuronal de
Retropropagacin, se orienta a desarrollar un prototipo experimental de un sistema de
reconocimiento de rostros humanos basado en una red neuronal de retropropagacin.
Se encuentran los parmetros para el aprendizaje de la red neuronal que permita maximizar la
tasa de reconocimiento de rostros humanos. Para desarrollar y probar el sistema de
reconocimiento, se utiliza la base de datos con rostros frontales desarrollada por Olivetti
Research Laboratory (ORL) en Cambridge.
Se realizan dos particiones diferentes a la base de datos. La primera, divide la base de datos en
dos conjuntos: entrenamiento y prueba. La segunda particin, la divide en tres: entrenamiento,
validacin y prueba. Se utiliza el mtodo de reduccin piramidal para disminuir la resolucin
espacial de las imgenes y, por consiguiente, el tamao del vector de entrada a la red neuronal,
como tambin, se vara el nmero de neuronas ocultas. Se utiliza estiramiento lineal de
contraste para modificar los histogramas de las imgenes, con el fin de normalizar la
luminosidad.
La red neuronal fue entrenada con los conjuntos de entrenamiento y su capacidad de
generalizacin se midi en los conjuntos de prueba de cada particin. Para la primera
particin, la mejor red neuronal para reconocimiento de rostros fue aquella con imgenes de
entrada de 23x28 pxeles y una arquitectura de tres capas del tipo 644-40-40, con parmetros
tasa de aprendizaje de 0,26 y momentum de 0,12. La tasa media de reconocimiento (TMR),
alcanzada por esta red neuronal, para ocho muestras aleatorias, es de un 95,63%, con una
desviacin estndar de 0,58%. El promedio del error cuadrtico medio (PECM) es de un
9,74%, con una desviacin estndar de 0,63% medidos en el conjunto de prueba. El error de
clasificacin obtenido es de un 4,37%. El modelo propuesto, requiere de 724 neuronas en total
y con un nmero de conexiones neuronales de 27.440 pesos, incluyendo bias. Este modelo
requiere solamente del 6,96% de la cantidad total de neuronas y de 4,41% de la cantidad total
de pesos requeridos por el modelo original, sin reduccin espacial. Con la segunda particin,
la TMR es, en el conjunto de validacin, de 91,04%, con una desviacin estndar de 0,74% y
el PECM es de 14,57%, con una desviacin estndar de 0,57%. Para el conjunto de prueba, la
TMR es de 85,94%, con una desviacin estndar de 1,57% y el PECM es de 17,17%, con una
desviacin estndar de 0,82%. La disminucin en las TMR y el aumento en el PECM, con
respecto a la primera particin, se debe a la disminucin en el conjunto de entrenamiento,
equivalente al 66,66%, causa de este decaimiento en el desempeo del sistema.
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

15

Estos resultados de clasificacin se contrastan con otros publicados en la literatura cientfica


sobre la misma base de datos. Se encuentra que los resultados obtenidos en este Proyecto de
Ttulo son comparables y superan los resultados obtenidos en las investigaciones
mencionadas.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

16

ABSTRACT
The Project Reconocimiento de Rostros Humanos Basado en una Red Neuronal de
Retropropagacin, is oriented to develop an experimental prototype system for human face
recognition based on a backpropagation neural network.
The neural network learning parameters are determined to maximize the face recognition rate.
The database of human faces developed by Olivetti Research Laboratory (ORL) in Cambridge
is used in the development and test of the system. Two different partitions are performed on
this database. The first one divides the database in two sets: training and test. The second
partition divides the database in three sets: training, validation and test. The resolution of the
input image is reduced by the pyramidal method and consequently the size of the input vector
to the neural network is reduced too, the number of hidden units in the neural network model
are varied as well. Besides, contrast linear stretching is used to modify the histograms of the
images with the purpose of normalizing the brightness. In each partition, the neural network is
trained with the training sets and the test sets is used to measure the generalization capacity of
the network. In the first partition, the best neural network model resulted to be one with 23x28
pixels input images, an architecture of three layers with 644-40-40 units, a learning rate of
0.26 and momentum of 0.12. The mean recognition rate (MRR), reached by this neural
network for eight different random initial weight sets is 95.63%, with a standard deviation of
0.58%. The average of the mean square error (AMSE) is 9.74%, with a standard deviation of
0.63% measured on the test set. The classification error is 4.37%.
The proposed model, requires a total of 724 neurons and 27,440 connection weights, including
bias. This model requires only 6.96% of the total number of neurons and 4.41% of the total
number of weights required by the original model without spacial resolution reduction. On the
second partition, the MRR is 91.04% on the validation set with a standard deviation of 0.74%
and the AMSE is 14.57%, with a standard deviation of 0.57%. On the test set, the MRR is
85.94% with a standard deviation of 1.57% and the AMSE is 17.17% with a standard
deviation of 0.82%. The decrease of the MRR and the increase of the AMSE obtained in the
second partition, relative to the first one, was due to the reduction on the training set size to
66.66%, thus reducing the system performance.
The classification results are compared with others published in the scientific literature on the
same database. It is found that the results obtained in this work are comparable or better than
those published.
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

17

CAPITULO I - INTRODUCCION
1.1 IMPORTANCIA DEL RECONOCIMIENTO DE ROSTROS HUMANOS
Existe muchos problemas en ingeniera que son difciles de abordar mediante un enfoque
algortmico tradicional. Por ello naci la necesidad de emular algoritmos inteligentes,
inspirados en sistemas biolgicos (Engel, 1978; Freeman et al., 1993; Kosko, 1992; Lippman,
1987; Rumelhart et al., 1986a; Rumelhart et al., 1986b). El reconocimiento de patrones en
imgenes digitales ha concitado gran inters en las ltimas dcadas, debido a que ha permitido
abordar problemas de inspeccin visual, de reconocimiento de nmeros y letras manuscritas,
como tambin, el reconocimiento de huellas dactilares, de rostros, etc (Ajenjo, 1993; Freeman
et al., 1993; Gmez et al., 1993; Gonzles, 1996; Kosko, 1992). El reconocimiento y
clasificacin de imgenes heterogneas ha sido abordado utilizando sistemas dinmicos
inspirados en modelos biolgicos (Chellappa et al., 1995; Dai et al., 1997; Freeman et al.,
1993; Gonzles et al., 1996; Kosko, 1992; Lawrence et al., 1997; Lee, 2001; Lee et al., 1996;
Lippman, 1987; Liu et al., 2000; Nakajima et al., 2000; Purnell et al., 1998; Rumelhart et al.,
1986a; Rumelhart et al., 1986b). En particular, el reconocimiento robusto de rostros humanos
por medio de herramientas computacionales, permitira varias aplicaciones en donde hoy en
da se requiere identificar particularmente a cada individuo (Brunelli et al., 1996; Chellappa et
al., 1995; Costen et al., 1996; Dai et al., 1997; Hu et al., 1999; Lawrence et al., 1997; Lee,
2001; Lee et al., 1996; Liu et al., 2000; Nsnen, 1999; Nakajima et al., 2000; Purnell et al.,
1998). Por ejemplo, sistemas de seguridad para laboratorios, bancos, isapres, tiendas
comerciales y todos aquellos lugares que necesitan identificar a sus propios clientes y
funcionarios, para dar acceso restringido. Verificacin en video conferencia, tarjetas de
crditos, carnet de identidad, identificacin criminal, etc.
Existen muchas aplicaciones que involucran reconocimiento de patrones, que sera deseable
automatizar, pero debido a que se desconoce el procedimiento utilizado en el reconocimiento,
es muy difcil disear un algoritmo adecuado para ser implementado en un computador tanto
secuencial como paralelo. El cmo una persona reconoce a otra, es un problema no resuelto.
Las personas saben reconocer a otras pero se desconoce el procedimiento que realiza el
cerebro para lograr este reconocimiento. Por ello, una alternativa es disear algoritmos que
permitan una solucin al problema mediante el aprendizaje de ejemplos (Freeman et al., 1993;
Gonzles et al., 1996; Lippman, 1987; Rumelhart et al., 1986a; MathWorks, 2000c).
Solucionar el problema de reconocimiento de rostros es una tarea compleja, los seres humanos
poseen varios msculos faciales, permitiendo una infinidad de diferentes expresiones, las
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

18

personas cambian constantemente su apariencia y no pueden evitar el cambio a travs del


tiempo por causa del envejecimiento celular. El cuello, adems, permite la movilidad
rotacional tanto en un plano trasversal como longitudinal con respecto al cuerpo, permitiendo
agregar mayores posibilidades de variacin en la rotacin en una imagen bidimensional del
rostro de una persona. La variacin de la iluminacin es un factor que influye
considerablemente y hace ser ms compleja aun la tarea. La clasificacin de rostros es un
problema de reconocimiento de patrones variable en el tiempo; por este motivo es importante
la utilizacin de modelos dinmicos que sean capaces de adaptarse. Las redes neuronales
artificiales poseen algunas caractersticas que simulan al cerebro humano y que permiten la
solucin de problemas, mediante el aprendizaje de ejemplos con capacidad de adaptacin.
1.2 OBJETIVOS
1.2.1 Objetivo General
Desarrollar un sistema de reconocimiento de rostros humanos, a nivel de prototipo
experimental, implementado en software, basado en una red neuronal de retropropagacin.
Estudiar la escala de resolucin adecuada para las imgenes en la entrada de la red neuronal y
los parmetros del aprendizaje de la red, que permitan maximizar la tasa de reconocimiento de
rostros humanos, permitiendo entrenar y medir su capacidad de generalizacin.
1.2.1 Objetivo Especifico

Implementar computacionalmente el modelo neuronal de retropropagacin para el


reconocimiento de rostros humanos.

Utilizar una base de datos de rostros humanos que permita entrenar la red neuronal y
medir su capacidad de generalizacin.

Determinar el conjunto de parmetros de entrenamiento de la red neuronal que logren


una convergencia rpida y eviten mnimos locales.

Determinar una resolucin adecuada para las imgenes de rostros humanos, que
permitan una clasificacin con mxima tasa de reconocimiento y mnima tasa de error.

Proponer un mtodo que permita normalizar la iluminacin en las imgenes de rostros


humanos, permitiendo una adecuada clasificacin.

Evaluar el comportamiento del modelo respecto de su tasa de reconocimiento y de


error en la base de datos de generalizacin.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

19

1.3 ANTECEDENTES DE INVESTIGACIONES PREVIAS


En los ltimos aos, se han publicado numerosos trabajos de investigacin sobre sistemas de
reconocimiento de rostros humanos siendo un tema objeto de prolfera actividad cientfica
(Brunelli, 1996; Chellappa et al., 1995; Costen et al., 1996; Dai et al., 1997; Hu et al., 1999;
Lawrence et al., 1997; Lee et al., 1996; Liu et al., 2000; Nsnen, 1999; Purnell et al., 1998).
Se ha investigado el desempeo de sistemas de reconocimiento en una poblacin heterognea
basado en la transformada de Karhunen-Love (KL), construyendo vectores y valores propios
de la imagen del rostro para luego su posterior clasificacin. Se concluye que los vectores
propios construidos usando la base de datos entera fueron mejores que los creados utilizando
grupos de poblaciones separados. Adems, se encontr que no hay diferencia significativa
entre el desempeo de grupos individuales, que cuando se usa una base comn (Purnell et al.,
1998).
En otro trabajo, se ha utilizado un mtodo de reconocimiento con un preprocesamiento de
extraccin de cinco caractersticas homogneas y normalizadas del rostro humano, asumiendo
que el rostro debe estar localizado al centro de la imagen. El reconocimiento est basado en un
algoritmo neuro-difuso de retropropagacin que fue comparado con un mtodo convencional
de retropropagacin. Los resultados de la simulacin se mostraron en funcin de varios
parmetros, concluyndose que el algoritmo neuro-difuso propuesto con una funcin
trapezoidal, entrega mejores resultados que el mtodo convencional (Lee et al., 1996).
Tambin, se ha mostrado los efectos de la frecuencia espacial en el reconocimiento de
imgenes de rostros humanos, umbral de razn seal/ruido para el reconocimiento de rostros
usando ruido aditivo espacial y sensibilidad relativa al reconocimiento para diferentes
frecuencias. Se concluye que en el reconocimiento de imgenes faciales previamente
aprendidas, la mayora de la informacin est reunida en una banda de frecuencia espacial que
est justo bajo dos octavas de ancho y centrada alrededor del ancho 8-13 ciclos por rostro
(Nsnen, 1999).
Por otra parte, se ha desarrollado sistemas de localizacin de cabeza y rostro en imgenes con
cabeza y hombros, basados en las detecciones de bordes. Algunas aproximaciones estn
basadas en mtodos globales como Snakes y transformada de Hough. Sin embargo, en
imgenes con fondo llano, se puede descubrir la cabeza y bordes de la cara y organizarlos en
lmites claros basados en tres modelos. Primero, el marco de la imagen de la cabeza y el
hombro puede ser localizado fcilmente por anlisis del histograma. Segundo, una deteccin
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

20

de borde es obtenida utilizando el operador de Sobel y tercero, el lmite de la cabeza es


dividido en lmites subalternos de izquierda a derecha donde cada uno de los lmites iniciales
pueden obtenerse directamente de los bordes. Los anlisis de forma de lmite son pasos
cruciales en este algoritmo (Hu et al., 1999).
Otro estudio, presenta un sistema de reconocimiento de rostros humanos que es una red
neuronal hbrida, que se compara favorablemente con otros mtodos. La red hbrida est
compuesta por una red neuronal Self Organizing Map (SOM) y de una red neuronal de
convolucin. La red SOM proporciona una reduccin dimensional e invariante a pequeos
cambios en una imagen de prueba. La red de convolucin, proporciona invarianza parcial
frente a la traslacin, rotacin, escala y deformacin, extrayendo exitosamente caractersticas
jerrquicas. Se utiliza la base de datos ORL (Olivetti Research Laboratory). Se presentan
resultados usando la Transformada de Karhunen-Love (KL) en lugar de la red SOM, 5,3 %
v/s 3,8 % de error respectivamente, y una red Perceptrn Multicapa en vez de la red de
convolucin, 40 % v/s 3,8 % de error respectivamente. El mtodo es rpidamente capaz de
clasificar, requiere slo normalizacin y pre-procesamiento. Muestra la mejor clasificacin en
el desempeo, aproximacin eigenfaces, considerada como el nmero de imgenes por
persona en la base de datos de entrenamiento, variada de 1-5. Con cinco imgenes por persona
los resultados del mtodo propuesto y eigenfaces son: 3,8 % y 10,5 % de error,
respectivamente (Lawrence et al., 1997).
Se ha presentado un nuevo mtodo de reconocimiento de imgenes faciales con baja
resolucin, utilizando 10 personas del laboratorio y 30 personas seleccionadas aleatoriamente
en la base de datos ORL y basado en el modelo de memoria de Hopfield. En este mtodo, el
modelo de la memoria de Hopfield para imgenes faciales es organizado y se determina el
procedimiento ptimo de aprendizaje sin supervisin. Se analiza la relacin entre la forma de
recordar y el nmero de rostros memorizados con la memoria de Hopfield. Finalmente, se
propone el mtodo para reconocimiento de rostros usando el modelo de memoria de Hopfield
combinado con un juego de patrones. Se obtuvo una tasa de reconocimiento de un 92 % y una
tasa de rechazo de un 5 % (Dai et al., 1997).
Reciente se ha investigado un nuevo mtodo adaptivo, anlogo a los algoritmos evolutivos o
genticos, utilizando anlisis de componentes principales para disminuir la dimensin del
vector y con posibles aplicaciones en codificacin, compresin y clasificacin de patrones
(Liu et al., 2000).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

21

Se han realizado estudios sobre la degradacin no lineal de imgenes de rostros humanos,


mediante efectos en el filtrado espacial pasa-alto y pasa-bajo para el cual existe un rango
mnimo crtico en la frecuencia espacial para un buen desempeo en sistemas de identificacin
de rostros. Los datos del filtrado pasa-bajo confirman que hay una discontinuidad y
disminucin para la identificacin de rostros, si las imgenes son degradadas por cuantizacin
o un filtrado de Fourier. Esto ocurre a un nivel entre 11,5 y 6 ciclos por rostro. La
discontinuidad no es nicamente debida al mtodo de degradacin, sino que tambin a la
condicin del pxel mismo. Los datos del filtrado pasa-alto muestran una disminucin en la
exactitud y aumento en el tiempo de respuesta, como tambin un aumento en la frecuencia de
corte alrededor de los 11,5 ciclos por rostro. Este resultado podra ser explicado por la energa
relativamente baja o el poco rango de nivel de gris visto en las imgenes. De hecho,
aumentando el contraste disponible en las imgenes disminuy la exactitud y aument el
tiempo de respuesta. Debe notarse que las manipulaciones que igualan el contraste de las
imgenes filtradas son antinaturales, pero puede lograr que cierta clase de informacin dentro
del rostro sea predominante, sin ser la informacin de inters real. Una alternativa de
algoritmo que podra capturar estos efectos es la codificacin de la configuracin de la
informacin por el tipo de distorsin de la superficie local presente en la imagen. Otra
alternativa podra ser la representacin de rostros mediante el uso de componentes principales
y anlisis del espectro. Se concluye finalmente que la identificacin del rostro depende
principalmente de la presencia de una banda de frecuencia espacial alrededor de 8-16 ciclos
por rostro. Resultados comparables deben obtenerse con la manipulacin de un filtro de
frecuencia espacial, pasa banda, de ancho constante (Costen et al., 1996).
En otro sistema de identificacin interactivo, se ha utilizado el anlisis de componentes
principales de imgenes de rostros, comparando las diferencias y semejanzas en las imgenes
de la base de datos de rostros. El sistema supera los inconvenientes mayores que afectan a los
sistemas informticos disponibles y proporciona un nmero ilimitado de variantes del rasgo y
una estimacin cuantitativa automtica de similitud de la imagen (Brunelli et al., 1996).
Otro gran inters en estas materias, se refleja en una revisin crtica de la literatura existente
sobre reconocimiento de rostros humanos escrita hasta Mayo de 1995, donde se resumen 20
aos de investigacin en psicofsica, neuro-ciencia, ingeniera, procesamiento de imgenes,
anlisis y visin computacional, mostrando que estas tcnicas se complementan para crear
mejores sistemas de reconocimiento hombre-mquina (Chellappa et al., 1995).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

22

CAPITULO II - MODELO DE LA RED NEURONAL DE


RETROPROPAGACION

2.1 INTRODUCCION
Para comprender mejor el modelo de la red neuronal de retropropagacin, es conveniente
revisar los modelos previos de redes neuronales, ya que permite conocer las limitaciones de
dichos modelos. Se hace nfasis en el modelo de retropropagacin debido a que es utilizado
como clasificador para el reconocimiento de rostros humanos.
Un tipo de clasificacin para las redes neuronales, son las denominadas redes de propagacin
hacia adelante, que se caracterizan por tener una arquitectura similar, donde sus conexiones
son solamente hacia adelante entre las neuronas pertenecientes a diferentes capas, pudiendo
ser monocapa o multicapas y con un tipo de aprendizaje supervisado (Cceres, 2002). En este
tipo de redes se pueden incluir los siguientes modelos:

Perceptron

Perceptron Multicapa

Adaline

Madaline

Retropropagacin

Para el estudio de la red neuronal de retropropagacin, basta con comprender previamente a


los modelos de Perceptron y Perceptron Multicapa. El estudio terico de la red Adaline y
Madaline pueden verse en detalle en el Proyecto de Licenciatura (Cceres, 2002).
2.2 PERCEPTRON
2.2.1 Introduccin
El Perceptron fue el primer modelo de red neuronal artificial concebido, desarrollado por
Rosenblatt en 1958 (Rosenblatt, 1958). Este modelo despert un gran inters debido a su
capacidad de aprender a reconocer patrones sencillos, pero disminuy considerablemente su
inters debido a sus limitaciones, dadas por su propia estructura y que slo le permiten
discriminar dos clases diferentes de patrones y que sean linealmente separables.
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

23

2.2.2 Arquitectura
En el caso ms general, el Perceptron posee un tipo de estructura de dos capas inmersa en un
espacio vectorial (n)-dimensional, donde la forma de clasificacin es realizada por un
hiperplano de (n-1)-dimensiones. Tiene la posibilidad de tener (n)-neuronas de entrada con
funciones de transferencias lineales y una neurona de salida con funcin de transferencia
escaln. En la Figura 1, puede verse su arquitectura realizando la propagacin hacia delante,
donde existe una neurona ficticia (N0) cuya salida es unitaria y cuyo peso posee un valor
equivalente al negativo del umbral de activacin. Un ejemplo de su limitacin, es la
imposibilidad de resolver la funcin lgica or-exclusiva (XOR), debido a que sus clases no
pueden ser separadas por una nica lnea recta (Freeman et al., 1993; Hilera et al., 1995).
FIGURA 1
ARQUITECTURA DE LA RED NEURONAL PERCEPTRON CON (N)NEURONAS DE ENTRADAS Y UNA DE SALIDA (Nj)

N0
x1

N1

y1

M
xj

Ni

y0 = 1

w1
yj

wi

wn

M
xn

w0 = j
Nj

n
(
t
)
=
yj
f j wi (t ) y i (t )

i =0

yn

Nn

2.2.3 Funcionamiento
El funcionamiento del Perceptron se basa en el mtodo de propagacin hacia adelante. Las
neuronas de entrada distribuyen informacin a la neurona de salida, que realizan una suma
ponderada de las entradas aplicando una funcin de transferencia de tipo escaln a la funcin
de activacin, netj(t), obtenida de un procesamiento previo (Ver Ecuacin 2.1).
Las conexiones que permiten interactuar las neuronas que conforman una red neuronal
artificial, tienen asociado un peso, o valor sinptico, que hace que la red adquiera
conocimiento. Cada neurona recibe un conjunto de seales que le genera informacin del
estado de activacin de las neuronas vecinas conectadas a ella. El potencial post-sinptico, que
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

24

recibe una neurona Nj en el instante t, netj(t), es la suma del producto de cada seal de salida,
yi(t), de cada neurona Ni, multiplicada por el valor de la conexin, o peso de la sinapsis, wji(t),
que conecta una neurona Ni con otra Nj en un instante t. Si wji es positivo, indica que la
sinapsis entre la neurona Ni y Nj es excitatoria, si wji es negativo, la sinapsis ser inhibitoria y
si wji = 0, se supone que no hay conexin entre dichas neuronas.
Por tanto, en trminos matemticos cada neurona realiza internamente la suma ponderada de
sus pesos con las salidas de las neuronas prximas conectadas a ella, lo que se representa en
forma escalar en la Ecuacin 2.1. Esta forma interna y externa de operar entre las neuronas es
lo que se conoce como regla de propagacin.
net j (t ) =

ji

(t ) y i (t )

(2.1)

i =1

La influencia conexional que poseen las neuronas Ni sobre otras neuronas Nj se puede
representar como una matriz de pesos, que vectorialmente se puede describir como en la
Ecuacin 2.2.
W = (w ji )

(2.2)

La ventaja de la notacin vectorial es que la Ecuacin 2.1 se puede escribir de forma


simplificada como en la Ecuacin 2.3.
NET (t ) = W (t ) Y(t)

(2.3)

2.2.4 Aprendizaje
El Perceptron posee un mecanismo de aprendizaje offline, supervisado y por correccin de
error, donde los pesos son ajustados para cada patrn que es entrenado. Relaciona los patrones
de entrada con la salida, en forma heteroasociativa. Puede ser considerado como una red
discreta e hbrida, ya que puede ser diseada para trabajar con entradas discretas y salidas
discretas, como tambin, con entradas continuas y salidas discretas respectivamente (Cceres,
2002).
Matemticamente, el algoritmo de aprendizaje para una red neuronal Perceptron puede
expresarse de la siguiente manera (Freeman et al., 1993; Hilera et al., 1995):

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

25

i. Inicializar aleatoriamente, el vector columna de los pesos asociados a las conexiones de la


red en el instante t=0, con valores pequeos aleatorios comprendidos en el intervalo continuo
[-0.5; 0.5] (Ver Ecuacin 2.4).

w0 (t )

W (t ) = M
w (t )
n

(2.4)

ii. Ingresar un nuevo vector columna, p-simo patrn de entrada en el instante t (Ver Ecuacin
2.5).
x p 0 (t )

X p (t ) = M

x p n (t )

(2.5)

Donde:
x p 0 (t ) =1
iii. Conocer el valor de salida deseado, para el nuevo p-simo patrn vectorial en el instante t
[Ver (2.6)].

d p (t )

(2.6)

iv. Obtener la salida de la red para el nuevo p-simo patrn vectorial en el instante (Ver
Ecuacin 2.7).
n

y p (t ) = f [X tp (t ) W (t )] = f x p i (t ) wi (t )
i =0

(2.7)

Donde:
f : representa una funcin escalar de transferencia tipo escaln
v. Calcular el error cometido para el patrn p-simo en el instante t (Ver Ecuacin 2.8).
e p (t ) = d p (t ) y p (t )

(2.8)

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

26

vi. Proceder a la modificacin de los pesos de la red para un nuevo instante (t+1), siempre que
ej(t) 0; j. Lo que puede escribirse vectorialmente (Ver Ecuacin 2.9) o en forma escalar
(Ver Ecuacin 2.10).

W (t + 1) = W (t ) + e p (t ) X p (t )

(2.9)

wi (t + 1) = wi (t ) + e p (t ) x pi (t ); i [0, n] N [0,1] R

(2.10)

vii. Finalmente, repetir desde ii. hasta vi. para cada uno de los (P)-patrones a entrenar y hasta
que ej(t) 0; j.
2.3 PERCEPTRON MULTICAPAS
2.3.1 Arquitectura
El Perceptron Multicapas es una ampliacin y generalizacin del Perceptron de dos capas.
Conserva la estructura del Perceptron, pero posee la ventaja de tener mltiples capas ocultas
como se muestra en la Figura 2. Esto le permite establecer regiones de decisin mucho ms
complejas, aprender mayor nmero de clases y solucionar problemas que el Perceptron, sin
capa ocultas, no puede resolver (Lippman, 1987).
FIGURA 2
ARQUITECTURA DE UNA RED NEURONAL PERCEPTRON
MULTICAPA CON PROPAGACION HACIA ADELANTE

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

27

Las capacidades del Perceptron Multicapa con una nica neurona de salida se pueden observar
en la Tabla 1 (Lippman, 1987). Se ve en general, que no se requieren ms de cuatro capas para
resolver un problema dado, ya que es suficiente para generar regiones de decisin
arbitrariamente complejas. En ciertos problemas, puede mejorarse el aprendizaje mediante la
variacin de la cantidad de neuronas ocultas por capas y/o con la extensin de la funcin de
activacin. Adems, un nmero excesivo de neuronas en alguna capa oculta, puede generar
ruido en el aprendizaje y un nmero adecuado, aunque sea redundante, permite que la red
posea mayor tolerancia a fallos.
No existe an, un mtodo analtico para determinar la cantidad ptima de neuronas en las
capas ocultas, por ello, se requiere de un anlisis estadstico del comportamiento del sistema
con diferentes cantidades de neuronas y que permita determinar la cantidad ptima para un
cierto problema dado.
TABLA 1
POSIBLES REGIONES DE DECISION CON DIFERENTES NUMEROS DE CAPAS Y DE
NEURONAS CON UNA RED NEURONAL TIPO PERCEPTRON MULTICAPA
ESTRUCTURA REGIONES DE
PROBLEMA
CLASES CON
FORMAS DE
DECISION
DEL XOR
REGIONES
REGIONES MAS
MEZCLADAS
GENERALES
MEDIO PLANO
2 CAPAS
LIMITADO POR
UN
HIPERPLANO
3 CAPAS

REGIONES
CERRADAS O
CONVEXAS

4 CAPAS

ARBITRARIA
COMPLEJIDAD
LIMITADA POR
EL NUMERO DE
NEURONAS

Fuente: (Lippman, 1987)

2.3.2 Funcionamiento
El funcionamiento del Perceptron Multicapa es idntico al Perceptron pero generalizado para
mltiples conexiones.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

28

2.3.3 Aprendizaje
El aprendizaje del Perceptron Multipaca se presenta en detalle, a continuacin, en la Seccin
2.4. Se tratan neuronas con funciones de transferencia continuas, permitiendo obtener una red
neuronal multicapa continua o hbrida.
2.4 RETROPROPAGACION (BACKPROPAGATION)
2.4.1 Introduccin
Rumelhart, Hinton y Williams en 1986 (Rumelhart et al., 1986), basndose en los trabajos de
investigadores como Werbos y Parker (Werbos, 1974; Parker, 1982), desarrollaron un tipo de
red neuronal basada en la arquitectura de un Perceptron Multicapa pero con una nueva regla
de aprendizaje denominada retropropagacin o propagacin del error hacia atrs, basado en
una generalizacin de la regla delta (Cceres, 2002; Freeman et al., 1993; Hilera et al.,
1995) ampliando el rango de aplicaciones que las redes neuronales de este tipo posean hasta
entonces.
2.4.2 Arquitectura
En general, en una red de retropropagacin, existe una capa de entrada con (n)-neuronas, al
menos una capa oculta con (l)-neuronas y una capa de salida con (m)-neuronas. No posee
conexiones hacia atrs entre neuronas de diferentes capas, ni laterales en neuronas de una
misma capa. Las neuronas i-simas de entrada se denominan Ii, las neuronas j-simas ocultas
Hj y las neuronas k-simas de salida Ok. Las componentes de entrada a las neuronas Ii se
denominan xi y las componentes de salida a las neuronas Ok se denominan yk. Los pesos
asociados entre las neuronas Ii y Hj se denominan wHI
ji y los asociados entre las neuronas Hj y
(Ver Figura 3).
las Ok se denominan wOH
kj
Una caracterstica importante del algoritmo de retropropagacin, es la representacin interna
del conocimiento que pueden realizar, gracias a las capas ocultas que lo permiten,
consiguiendo cualquier correspondencia entre los patrones de entrada y la de salida (Ver Tabla
1).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

29

FIGURA 3
ARQUITECTURA DE UNA RED NEURONAL DE RETROPROPAGACION BASADO EN UN
PERCEPTRON MULTICAPAS
OH

w11

HI

x1

w11

I1

H1

HI
1i

w ji

HI
li

wln

wkj

OH

HI

wl1

Ok

OH
mj

yk

OH

wm1

OH

HI

In

wkl

OH

wk 1
OH

Hj
HI
jn

xn

w1l

HI

w j1

Ii

y1

OH

HI

xi

HI

w1n

O1

OH
1j

Hl

wml

Om

ym

2.4.3 Funcionamiento
El funcionamiento de la red de retropropagacin se basa en el mtodo de propagacin hacia
adelante extendido para mltiples neuronas, donde cada neurona de capas inferiores ir
procesando los patrones de entrada, generando nueva informacin de salida que servir
nuevamente de entrada a neuronas que estn en capas superiores. As, la informacin se ir
propagando en forma sucesiva desde la entrada hacia la salida de la red. Una diferencia con
respecto al Perceptron o Perceptron Multicapa es la funcin de transferencia que aplican las
neuronas, siendo sta de tipo sigmoidal, artangencial o gaussiana, segn el problema en
cuestin que se quiera resolver.
2.4.4 Aprendizaje (Regla delta generalizada)
La regla delta propuesta por Widrow en 1960 (Freeman et al., 1993; Hilera et al., 1995;
Widrow et al., 1960), fue generalizada a redes con conexiones hacia adelante, con mltiples
capas, cuyas neuronas poseen funciones de transferencia continuas, no decrecientes y
derivables, dando forma a lo que se conoce como regla delta generalizada o algoritmo de
retropropagacin del error. Esta red posee un mecanismo de aprendizaje offline, de tipo
supervisado y por correccin de error. Relaciona los patrones de entrada con la de salida, en
forma heteroasociativa y es considerada como una red anloga, ya que puede operar con
patrones con valores continuos tanto en la entrada, como en la salida.
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

30

El mtodo de aprendizaje est basado en dos fases de propagacin:

Hacia adelante. En la fase de propagacin hacia adelante los patrones de entrada son
propagados por la red a travs de sus mltiples capas hasta generar la salida. Obtenido
el vector de salida, este es comparado con el deseado, mediante los errores cuadrticos
cometidos.

Hacia atrs. En la fase de propagacin del error hacia atrs, debido a que se desconoce
la salida deseada para las neuronas pertenecientes a capas ocultas, el error es
propagado desde la capa de salida hacia las capas ocultas modificando los pesos
asociados a dichas conexiones hasta llegar a la capa de entrada. As, se habrn
modificado todos los pesos de la red, ajustndose al patrn que recientemente le fue
presentado. Si se realiza nuevamente una propagacin hacia adelante con el mismo
patrn, la red habr disminuido su error en la salida, en comparacin con el error
cometido en la propagacin anterior.

As sucesivamente, a la red se le podrn ir presentando nuevos patrones, para que vaya


autoajustando sus pesos con el fin de aprenderlos y de cometer un error que sea mnimo.
Los pesos asociados a las conexiones entre neuronas de diferentes capas, pueden representarse
vectorialmente mediante matrices. En una red que posee (n)-capas, se requerirn (n-1)matrices para representar sus pesos. En el caso particular que se analizar, por ser el ms
aplicado y utilizado, se requerirn tres capas: de entrada (I), oculta (H) y de salida (O). Por lo
que se necesitarn dos matrices para representar todos los pesos de la red.
La primera matriz, representar los pesos asociados a las conexiones entre la capa de entrada y
la capa oculta, en un instante t (Ver Ecuacin 2.11) y la segunda matriz, representa los pesos
de las conexiones entre la capa oculta y la de salida, en un instante t (Ver Ecuacin 2.12).
HI
HI
w11
(t) L w1HIi (t) L w1n
(t )

M
M
M
HI

HI
HI
HI
HI
W (t ) = ( w ji (t )) = w j1 (t) L w ji (t) L w jn (t )
M
M
M
HI

HI
HI
wl1 (t) L w li (t) L wln (t )

(2.11)

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

31

OH
w11
(t) L w1OHj (t) L w1lOH (t )

M
M
M

OH
OH
OH
OH
OH
W (t ) = ( wkj (t )) = wk 1 (t) L w kj (t) L w kl (t )
M

M
M
OH

OH
wm1 (t) L w OH

mj (t) L wml (t )

(2.12)

Donde:
QR
w yx (t ) : peso asociado a la conexin entre una neurona Ny de la capa Q con otra neurona Nx

de la capa R en un instante t y donde R es una capa inferior a Q.


Matemticamente, el algoritmo de aprendizaje para una red neuronal de Retropropagacin
puede expresarse de la siguiente manera (Freeman et al., 1993; Hilera et al., 1995):
i. Iniciar todos los pesos de la red en el instante (t=0) con valores pequeos aleatorios
comprendidos en el intervalo continuo [-0.5; 0.5].
ii. Presentar un nuevo p-simo patrn vectorial de entrada en el instante t (Ver Ecuacin 2.13).
x p1 (t )

X p (t ) = M

x p n (t )

(2.13)

iii. Especificar la salida vectorial deseada para el nuevo p-simo patrn, en el instante t (Ver
Ecuacin 2.14).

d Op1 (t )

O
D p (t ) = M
O

d p (t )
m

(2.14)

iv. Obtener la salida vectorial de la red para el p-simo patrn en el instante t (Ver Ecuacin
2.15).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

32

y Op (t )
1
O
Y p (t ) = M

y Op (t )
m

(2.15)

Para obtener la salida Y Op (t ) es necesario conocer las salidas de cada una de las neuronas
pertenecientes a cada capa de la red, lo que se logra realizando la propagacin hacia adelante.
Para ello, se deber hacer lo siguiente:

Calcular la funcin de activacin para cada neurona Nj perteneciente a la capa oculta


(H), con la informacin procedente de las neuronas Ni pertenecientes a la capa de
entrada (I) y con los pesos asociados entre dichas capas. Adems, se debe utilizar el
umbral de activacin para todas las neuronas pertenecientes a todas las capas de la red,
salvo la de entrada. Recordar que el umbral de activacin puede ser modelado como un
peso adicional de conexin entre una neurona conocida con una neurona ficticia
adicional cuya salida siempre es unitaria.
El umbral de activacin vectorial de la capa oculta, para un p-simo patrn de
entrenamiento en el instante t, se representa en la Ecuacin 2.16.

Hp1 (t )

(
)
=
t
M
p
H
p (t )
l

(2.16)

La funcin de activacin de la capa oculta, para un p-simo patrn de entrenamiento en


el instante t, se puede calcular vectorialmente (Ver Ecuacin 2.17) y en forma escalar
(Ver Ecuacin 2.18).

net Hp1 (t )

H
HI
H

(
)
=
(
)
(
)

(
)
=
M
t
t
t
t
p
NET p
W
Xp
H
net p (t )
l

(2.17)

H
HI
H
net p j (t ) = w ji (t ) x p i (t ) p j (t )

(2.18)

i =1

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

33

Aplicando la idea de la neurona ficticia, la expresin escalar de la Ecuacin 2.18 puede


ser reducida a la Ecuacin 2.19.
n

H
HI
net p j (t ) = w ji (t ) x p i (t )

(2.19)

i =0

Donde:
HI
H
w j 0 = pj

x p0 = 1

Proceder a calcular vectorialmente las salidas de cada una de las neuronas de la capa
oculta para el p-simo patrn en el instante t. Lo que se puede representar
vectorialmente (Ver Ecuacin 2.20) y en forma escalar (Ver Ecuacin 2.21).
Y p (t ) = f H ( NET p (t ))
H

(2.20)

___

H
H
y p j (t ) = f j (net Hp j (t )) ; j [1, L] N

(2.21)

Donde:
H
f j : funcin de transferencia escalar de la neurona Nj perteneciente a la capa oculta.

f H : funcin de transferencia vectorial de todas las neuronas pertenecientes a la capa


___

oculta.

Calcular la funcin de activacin para cada neurona Nk perteneciente a la capa de


salida (O), con informacin procedente de las neuronas Nj pertenecientes a la capa
oculta (H) y con los pesos asociados entre dichas capas.
El umbral de activacin vectorial de la capa de salida, para un p-simo patrn de
entrenamiento en el instante t, se representa por la Ecuacin 2.22.

Op1 (t )

Op (t ) = M
O

p (t )
m

(2.22)

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

34

La funcin de activacin de la capa de salida, para un p-simo patrn de entrenamiento


en el instante t, se puede calcular vectorialmente (Ver Ecuacin 2.23) y en forma
escalar (Ver Ecuacin 2.24).

net Op1 (t )

O
OH
O
H

NET p (t ) = W (t ) Y p (t ) p (t ) = M
O

net p (t )
m

(2.23)

H
O
OH
net (t ) = wkj (t ) y p j (t ) p k (t )
O
pk

(2.24)

j =1

Aplicando la idea de la neurona ficticia, la expresin escalar de la Ecuacin 2.24 puede


ser reducida a la Ecuacin 2.25.
l

H
OH
net (t ) = wkj (t ) y p j (t )
O
pk

(2.25)

j =0

Donde:
OH
O
wk 0 = p k

y p0 = 1
H

Se procede a calcular vectorialmente las salidas de cada una de las neuronas de la capa
de salida para el p-simo patrn en el instante t. Lo que se puede escribir
vectorialmente (Ver Ecuacin 2.26) y en forma escalar (Ver Ecuacin 2.27).
Y p (t ) = f O ( NET p (t ))
O

(2.26)

___

y p k (t ) = f k (net Opk (t )) ; k [1, m] N


O

(2.27)

Donde:
O

f k : funcin de transferencia de la neurona Nk perteneciente a la capa de salida.


f O : funcin de transferencia vectorial de todas las neuronas pertenecientes a la capa
___

de salida.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

35

v. Procedimiento para a calcular los trminos de error () para todas las neuronas
pertenecientes a todas las capas de la red, salvo la de entrada, propagando el error hacia atrs.

Clculo escalar del error en neuronas de salida (Ver Ecuacin 2.28).

Opk (t ) = d Opk (t ) y p k (t )

] net (t ) [ f (net (t ))] ; k [1, m] N


O
k

O
pk

O
pk

(2.28)

Clculo escalar del error en neuronas ocultas (Ver Ecuacin 2.29).

Hp j (t ) = Opk (t ) wOH
kj (t )

k =1

net

H
pj

[f

H
j

(net Hpj) ; j [1, l] N

(2.29)

vi. Actualizacin de los pesos de la red, corrigiendo hacia atrs desde la salida hacia la
entrada.

Corregir los pesos asociados a las conexiones entre la capa de salida y la oculta (Ver
Ecuacin 2.30).
OH
OH
OH
wkj (t + 1) = wkj (t ) + wkj (t + 1)

H
OH
OH
O
wOH
kj (t + 1) = p k (t ) y p (t ) + [w kj (t ) w kj (t 1) ]
j

Donde:

: Tasa de aprendizaje (Learning Rate) (0 < 1).


: Momento (Momentum) (0 < 1).
Por lo tanto:
H
OH
OH
OH
OH
O
wkj (t + 1) = wkj (t ) + p k (t ) y p j (t ) + [wkj (t ) wkj (t 1)]

(2.30)

Corregir los pesos asociados a las conexiones entre la capa oculta y la de entrada (Ver
Ecuacin 2.31).
HI
HI
HI
w ji (t + 1) = w ji (t ) + w ji (t + 1)

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

36

H
HI
HI
w HI
ji (t + 1) = p j (t ) x p i (t ) + [w ji (t ) w ji (t 1) ]

Por lo tanto:
H
HI
HI
HI
HI
w ji (t + 1) = w ji (t ) + p j (t ) x p i (t ) + [w ji (t ) w ji (t 1) ]

(2.31)

vii. El proceso de aprendizaje se repite para todos los patrones hasta que el trmino de error
total (Ver Ecuacin 2.32) sea considerado aceptablemente pequeo.
Sea:

Opk (t ) = d Opk (t ) y p k (t )
O

Entonces:
e p (t ) =

1
2

[
m

k =1

O
pk

(t )

y eT (t ) =

1 p
es(t )
p s =1

Por lo tanto:
1
eT (t ) =
2p

[d
p

s =1 k =1

O
sk

(t ) y Osk (t )

(2.32)

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

37

CAPITULO III - IMPLEMENTACION COMPUTACIONAL DE LA RED


NEURONAL DE RETROPROPAGACION
3.1 INTRODUCCION
La implementacin computacional de la red neuronal de retropropagacin, fue realizada en
software, en un lenguaje de programacin, orientado a objetos, de alto nivel, denominado
Object Pascal conocido como DELPHI y desarrollado por la empresa Inprise Corporation
(Ex Borland Corporation) (Inprise, 2000). La versin utilizada es DELPHI 6 concebida para
plataformas: Windows 95/98/Me, Windows NT/2000 y Windows XP. Este lenguaje es
utilizado, debido a su buen rendimiento en dichas plataformas, como adems, su rpida
capacidad de exportacin de cdigo para que sea funcional en plataforma Linux. Esto permite
con un mismo cdigo, sin necesidad de una gran modificacin, el poder tener un slo
programa para ambas plataformas de sistemas operativos: Windows y Linux.
Previamente a la implementacin, es muy importante definir los principales elementos y
caractersticas que conforman la red neuronal y homologar su modelacin matemtica a una
posible modelacin computacional a travs de algoritmos y estructuras de datos.
La red neuronal de retropropagacin, en este proyecto, se utiliza como un clasificador para
reconocimiento de patrones y se espera que logre aprender a reconocer personas por medio de
imgenes bidimensionales de sus rostros y de baja resolucin.

3.2 CODIFICACION DE LA NEURONA ARTIFICIAL


La neurona artificial se puede modelar como una estructura de dato denominada registro. Para
cada neurona (registro Neuron) se deben definir tres valores reales que son tres caractersticas
fundamentales que las definen. Una caracterstica es su salida (y), otra es su funcin de
activacin (net) y la tercera son los trminos de error () obtenidos de la propagacin hacia
atrs del error (Backpropagation) donde se propaga informacin desde la salida y hacia la
entrada de la red para cada una de las neuronas que procesan datos.
La neurona artificial puede definirse e implementarse computacionalmente a travs de Object
Pascal de la siguiente manera:

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

38

type
Neuron = record
y: real;
net: real;
Dlta: real;
end;
Para cada neurona artificial existe una cuarta caracterstica, que es la funcin de transferencia
utilizada en red de retropropagacin. La utilizada es la funcin sigmoidal (Cceres, 2002) y
que fue implementada y definida como tal, en Object Pascal, de la siguiente manera:

function TFormPrincipal.sigmoidal(valor:real):real;
begin
Result:= 1/(1+Exp(-valor));
end;
Donde:
TformPrincipal es el componente objeto que define al formulario principal del programa de la
red neuronal (Inprise, 2000).

3.3 MODELACION Y CODIFICACION DE LA ARQUITECTURA


La arquitectura de la red neuronal de retropropagacin, utilizada en este proyecto, puede verse
representada en la Figura 3, que representa al modelo matemtico de la red. As, tambin, la
modelacin computacional utilizada puede verse representada en la Figura 4.
Muy importante son las conexiones interneuronales o pesos de la red, pues almacenan el
conocimiento que la red adquiere en el proceso de aprendizaje. El modelo matemtico,
representa dicho conocimiento almacenado en matrices de conectividad (Ver Ecuaciones 2.11
y 2.12). El modelo computacional tambin representa los pesos como matrices, o mejor dicho,
como vectores dinmicos de vectores dinmicos, que existen en Object Pascal. Para
implementar la memoria dinmica, en dicho lenguaje, se exige la utilizacin de listas
dinmicas enlazadas, lo que es una muy buena herramienta de modelacin dinmica, pero que
almacena informacin en espacios de memoria disjuntos o en cualquier espacio de memoria
disponible, accediendo a ella mediante direccionamientos de memoria conocida como
punteros. La ventaja que posee la memoria esttica, es que almacena en forma ordenada la
informacin, en casilleros de memoria adjuntos, lo que permite acelerar considerablemente la
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

39

bsqueda y el acceso a ella, su limitante era el hecho de ser esttica, como su nombre bien lo
dice, o sea, una vez definido el nmero de componentes del vector, no era posible variarlo en
tiempo de ejecucin. Object Pascal, permite la existencia de vectores dinmicos, lo que es una
poderosa herramienta para modelar los vectores bidimensionales utilizados en la red neuronal.
En la Figura 4, se muestran las estructuras de datos utilizadas para la implementacin de la red
neuronal en software. Principalmente, existe un vector de cinco componentes, denominado
Red Neuronal, que en las primeras dos componentes almacena los parmetros del
entrenamiento, tales como: tasa de aprendizaje (learning rate) y momento (momentum), pero
que adems, almacena en sus tres componentes restantes los punteros a las estructuras
vectoriales dinmicas que representan las capas de la red neuronal y que son: entrada, oculta y
salida.
Las estructuras vectoriales dinmicas entrada y salida, almacenan los punteros a los
registros que representan las neuronas artificiales denominadas Neuron, correspondiente,
respectivamente, a las neuronas de entrada y de salida de la red neuronal. Pero, adems, estas
estructuras vectoriales dinmicas (entrada y salida) almacenan los punteros a los vectores
dinmicos bias y pesos, que representan los umbrales de activacin de cada neurona y los
pesos correspondiente al aprendizaje de la red neuronal, respectivamente.
Es claro que para la capa de entrada (vector dinmico entrada), las componentes bias y pesos,
se muestran apuntadas a tierra (nil), debido a que no existen umbrales, ni pesos en la capa de
entrada de esta red neuronal. Lo que no ocurre para la capa de salida (vector dinmico salida),
que s posee umbrales de activacin para las neuronas de salida y pesos que corregir en la
etapa de entrenamiento.
La estructura vectorial dinmica oculta, es levemente diferente de las otras dos ya
mencionadas. Esta diferencia, radica en que las capas de entrada y de salida en una red
neuronal son nicas, lo que no es el caso de la capas ocultas, donde pueden existir varias.
Debido a que en este proyecto se utiliz una red neuronal de tres capas, y por tanto, de slo
una capa oculta, la estructura vectorial dinmica oculta posee en su primera componente el
puntero hacia la estructura vectorial dinmica que representa la capa oculta, donde almacena
los registros neuron, correspondiente a las neuronas ocultas y los punteros bias y pesos,
correspondiente, respectivamente, a los umbrales de activacin de las neuronas ocultas y a las
conexiones neuronales entre la capa de entrada y la oculta.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

40

FIGURA 4
MODELACION COMPUTACIONAL, MEDIANTE ESTRUCTURA DE DATOS, DE LA
ARQUITECTURA DE LA RED NEURONAL DE RETROPROPAGACION DE LA FIGURA 3
NEURON
y
net

PATRON

Dlta

ENTRADA

RED NEURONAL

x1

NEURON

xi

net

Dlta

xn

I1

NEURON

Ii

net

Dlta

ENTRADA

NEURON

In

Bias

net

Pesos

Dlta

Learning Rate
BIAS

Momentum

Dlta

Hl

NEURON
y
net

PESOS
HI

w11

Dlta

O1

HI

w j1

NEURON

Ok

net

wl1

Om

Dlta

Bias
Pesos

HI

HI

w1i

w ji
wli

w1l

HI

HI

HI

Bias
Pesos

w1n

SALIDA

net

w jn

M
Hidd c

M
Hj

Salida

Hidd 1

Oculta

OCULTA

NEURON

Entrada

H1

wln

HI

HI

NEURON

y1

net

yk

Dlta

SALIDA

NEURON

ym

y
net

OH
k1

OH
m1

OH

w1 j
wkj

wmj

OH

OH

OH

w11

PESOS

BIAS

Dlta

OH

OH

wkl

OH

wml

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

41

La modelacin computacional de los pesos de la red se simplifica considerablemente y se


pueden modelar declarndolos como simples variables y que, en Object Pascal, se expresa de
la siguiente forma:

var
wHI, wOH: array of array of real;
Anlogamente, otra caracterstica importante que se define en la arquitectura de una red y en
su aprendizaje son los umbrales de activacin (Bias), que son necesarios en cada neurona para
definir el corrimiento horizontal de la funcin de transferencia que vara en cada aprendizaje
en la medida que mejor se adapta a los patrones aprendidos y que no siempre est centrada en
el origen. Los bias se modelan tambin como variable, mediante la utilizacin de vectores
dinmicos unidimensionales y que, en Object Pascal, se expresan de la siguiente forma:

var
wHI0, wOH0: array of real;
La red de retropropagacin por ser una red multicapa, y que en este caso utiliza tres capas
(entrada, oculta y salida), necesita que en cada capa el nmero de neuronas sea variable en
tiempo de ejecucin, por tanto, las capas de la red tambin se modelaron mediante la
utilizacin de vectores dinmicos unidimensionales, donde cada capa, componente del vector,
debe ser una estructura de dato del tipo Neuron definida anteriormente.
La modelacin, en Object Pascal, de las neuronas ocultas y de salida de la red neuronal se
expresan de la siguiente manera:

var
NH, NO: array of Neuron;
Donde:
NH: Representa a las neuronas ocultas (Neuron Hidden).
NO: Representa a las neuronas de salida (Neuron Output).
Cabe hacer notar, que las neuronas de entrada slo distribuyen los patrones de entrada a las
neuronas ocultas, por lo tanto, el modelo computacional de la estructura de dato que representa
la arquitectura de la red de retropropagacin (Ver Figura 4) se modifica simplificndose
considerablemente (Ver Figura 5).
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

42

FIGURA 5
SIMPLIFICACION EN LA ESTRUCTURA DE DATOS DEL MODELO COMPUTACIONAL
x1

M
xi

M
xn

H1

Hj

HI
l1

HI
ji

OH

Ok

w1l

HI
li

M
M

HI
j1

HI

w1i

O1

HI

w11

Hl

HI

w1n

HI

w jn

HI

wln

Om
y1

yk

OH
k1

OH

wm1

OH
kj

wmj

OH

OH

OH

w1 j

wkl

OH

w11

ym

wml

OH

Como se mencion al inicio del captulo, otras de las caractersticas importantes de la red, es
considerar el tipo de patrones de entrada y de salida que sta procesar. Debido a la
modificacin anterior, es necesario definirse el vector de entrada para la red (X), como el
vector de salida deseado (NOD) que se espera que la red aprenda, y que, adems, realiza la
supervisin, permitiendo que la red calcule su error y corrija sus pesos.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

43

Dichos vectores se implementaron como vectores dinmicos unidimensionales, que en Object


Pascal, se definieron de la siguiente manera:

var
x: array of real;
NOD: array of byte;
Cabe hacer notar que el vector de entrada representa una imagen en escala de grises con 256
niveles posibles, con valores enteros entre 0-255, por lo tanto, las componentes del vector de
entrada se definieron como byte. Por otra parte, las componentes del vector de salida por ser
asintticamente binarias [0,1], se definieron como real. Definir variables como byte, permite
minimizar el tamao de reserva de memoria, para no hacer un mal uso innecesario de lla.

3.4 CODIFICACION DE LA PROPAGACION HACIA DELANTE


El modelamiento matemtico del funcionamiento de la red neuronal de retropropagacin, est
basado en el mtodo de propagacin de hacia adelante. Dicho modelo fue implementado
computacionalmente, en Object Pascal, como un procedimiento (procedure), debido a que
tanto en la etapa de funcionamiento, como en la etapa de aprendizaje de la red, ste es
requerido y utilizado constantemente en cada iteracin de dichos procesos.
Este procedimiento utiliza dos parmetros importantes en su definicin. El parmetro str,
que representa al vector de entrada a la red neuronal y el parmetro strn, que representa al
vector de salida de la red. Estos parmetros son importantes, ya que informan al procedimiento
quien ser el vector de entrada en un instante dado, o sea, que patrn est siendo propagado, y
cual ser el vector de salida heteroasociado por la red neuronal.
Es claro que el vector de salida obtenido por la red depender de los pesos almacenados, y por
tanto, existir un error con respecto al vector de salida deseado o esperado (Ver Ecuacin
2.32).
Para asociar mejor la relacin entre este procedimiento y su formulacin matemtica se
sugiere revisar las Ecuaciones 2.20 y 2.26 (Ver Captulo II).
El procedimiento de propagacin hacia adelante (ForwardPropagation) fue implementado en
Object Pascal de la siguiente manera:

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

44

procedure TFormPrincipal.ForwardPropagation(str: array of real; var strn: array of


Neuron);
var
i, j, k: integer;
BEGIN
For j:= 0 to L-1 do
begin
NH[j].net:= 0;
For i:= 0 to N-1 do
NH[j].net:=NH[j].net + (str[i] * wHI[j,i]);
NH[j].net:= NH[j].net + wHI0[j];
NH[j].y:= sigmoidal(NH[j].net);
end;
For k:= 0 to M-1 do
begin
NO[k].net:= 0;
For j:= 0 to L-1 do
NO[k].net:= NO[k].net + (NH[j].y * wOH[k,j]);
NO[k].net:= NO[k].net + wOH0[k];
strn[k].y:= sigmoidal(NO[k].net);
end;
END;
Donde (Ver Figura 3):
N: Representa la cantidad de Neuronas de Entradas.
L: Representa la cantidad de Neuronas Ocultas.
M: Representa la cantidad de Neuronas de Salidas.

3.5 CODIFICACION DE LA PROPAGACION HACIA ATRAS


La implementacin computacional de la propagacin hacia atrs en una red neuronal de
retropropagacin es muy importante, debido a que en esta etapa la red calcula los trminos de
error () que posteriormente utiliza en el proceso de modificacin de sus pesos. Dicho proceso
fue implementado, en Object Pascal, como un procedimiento (Ver Seccin 3.3). Para asociar
mejor la relacin entre este procedimiento y su formulacin matemtica se sugiere revisar las
Ecuaciones 2.28 y 2.29 (Ver Captulo II)..

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

45

El procedimiento de propagacin hacia atrs (Backpropagation) fue implementado, en Object


Pascal, de la siguiente manera:

procedure TFormPrincipal.Backpropagation;
var
j, k: integer;
BEGIN
For k:= 0 to M-1 do
NO[k].Dlta:= (NOD[k]-NO[k].y) * NO[k].y * (1-NO[k].y);
For j:= 0 to L-1 do
begin
NH[j].Dlta:= 0;
For k:= 0 to M-1 do
NH[j].Dlta:= NH[j].Dlta + (NO[k].Dlta * wOH[k,j]);
NH[j].Dlta:= NH[j].Dlta * NH[j].y * (1-NH[j].y);
end;
END;
3.6 CODIFICACION PARA LA MODIFICACION DE PESOS
La implementacin computacional de la modificacin de pesos en una red neuronal de
retropropagacin es muy importante, debido a que en esta etapa la red logra adaptar sus
conexiones neuronales para guardar su conocimiento, aprendiendo de su propio error. Este
proceso est implementado, en Object Pascal, como un procedimiento. Se requiere la
utilizacin de dos parmetros importantsimos para la modificacin de pesos; uno es el
parmetro tasa de aprendizaje o learnig rate (Lr), que define la forma como el vector
gradiente avanza por la superficie de error. El otro parmetro es el momento o
momentum (Mt), que otorga informacin al vector gradiente de la ltimas modificaciones
realizadas en el avance por la superficie de error, lo cual le permite tener una mayor tendencia
a dicho curso, generando un aumento en la rapidez de la convergencia del algoritmo. Estos dos
parmetros, bien seleccionados, permiten que el algoritmo encuentre el mnimo global de la
superficie de error, sin caer en los posibles mnimos locales. Para asociar mejor la relacin
entre este procedimiento y su formulacin matemtica se sugiere revisar las Ecuaciones 2.30 y
2.31 (Ver Captulo II).
El procedimiento de modificacin de pesos de la red (WeightChange) fue implementado, en
Object Pascal, de la siguiente manera:
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

46

procedure TFormPrincipal.WeightChange;
var
i, j, k: integer;
LR, Mom, aux: real;
BEGIN
Lr:= StrToFloat(EditLearningRate.text);
Mt:= StrToFloat(EditMomentum.text);
For k:= 0 to M-1 do
begin
aux:= wOH0[k];
wOH0[k]:= wOH0[k] + (Lr*NO[k].Dlta) + Mt*(wOH0[k]-wOH0_Aux[k]);
wOH0_Aux[k]:= aux;
For j:= 0 to L-1 do
begin
aux:= wOH[k,j];
wOH[k,j]:= wOH[k,j] + (Lr*NO[k].Dlta*NH[j].y) +Mt*(wOH[k,j]-wOH_Aux[k,j]);
wOH_Aux[k,j]:= aux;
end;
end;
For j:= 0 to L-1 do
begin
aux:= wHI0[j];
wHI0[j]:= wHI0[j] + (Lr*NH[j].Dlta) + Mt*(wHI0[j]-wHI0_Aux[j]);
wHI0_Aux[j]:= aux;
For i:= 0 to N-1 do
begin
aux:= wHI[j,i];
wHI[j,i]:= wHI[j,i] + (Lr*NH[j].Dlta*x[i]) + Mt*(wHI[j,i]-wHI_Aux[j,i]);
wHI_Aux[j,i]:= aux;
end;
end;
END;

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

47

3.7 CODIFICACION DEL APRENDIZAJE


La implementacin del aprendizaje es fundamental para el entrenamiento de la red neuronal.
La red utilizar todos los procedimientos explicados anteriormente y que le permitirn ajustar
sus conexiones neuronales para aprender los patrones vectoriales que sern entrenados. De
esta forma, la red para cada iteracin del aprendizaje propagar hacia adelante un patrn.
Calcular, entonces, los errores cometidos en las neuronas de las capas ocultas y de salida
mediante la propagacin hacia atrs. Con dicha informacin, proceder a realizar la
modificacin de los pesos para minimizar el error cuadrtico medio total, obtenido de la
comparacin del vector de salida versus el esperado (supervisin).
La implementacin computacional del aprendizaje de la red neuronal de retropropagacin en
este proyecto, requiere de los siguientes tres procedimientos:

Propagacin hacia adelante (Ver Seccin 3.4).

Propagacin hacia atrs (Ver Seccin 3.5).

Modificacin de pesos (Ver Seccin 3.6).

Existen dos procedimientos encargados de ingresar a la red los patrones de entrada y los de
salida deseados, logrando as la heteroasociacin. Dichos procedimientos son:

PatternsRead: que lee los patrones vectoriales de entrada.

OutputRead: que lee la clasificacin de salida deseada o correcta.

Existen algunas variables locales definidas en el procedimiento de aprendizaje y que son


utilizadas con finalidades especficas de almacenamiento en que:

p: p-simo patrn que est siendo entrenado.

Epoch: nmero de pocas que la red ser entrenada (Cceres, 2002).

Iteraciones: cantidad de procesos que la red ha completado.

MontoEpoch: pocas de entrenamientos deseadas por el usuario.

Anlogamente, existen tambin tres variables globales utilizadas para almacenar el nmero de
patrones de entrenamientos (NumPatternsTraining), el nmero de patrones de validacin
(NumPatternsValidation) y el nmero de patrones de prueba (NumPatternsTest).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

48

La implementacin del algoritmo de aprendizaje para la red neuronal de Retropropagacin se


puede expresar, en Object Pascal, de la siguiente manera:

procedure TFormPrincipal.AprendizajeClick(Sender: TObject);


var
j, p, Iteraciones, Epoch, MontoEpoch: integer;
BEGIN
while (Epoch<MontoEpoch) do
begin
PatternsRead('Training',x,p);
OutputRead(NOD,p,PtTraining);
ForwardPropagation(x,NO);
BackPropagation;
If p= NumPatternsTraining-1 then
begin
Epoch:= Inc(Epoch);
For j:=0 to NumPatternsValidation-1 do
begin
PatternsRead('Validation',x,j);
OutputRead(NOD,j,PtValidation);
ForwardPropagation(x,NO);
end;
For j:= 0 to NumPatternsTest-1 do
begin
PatternsRead('Test',x,j);
OutputRead(NOD,j,PtTest);
ForwardPropagation(x,NO);
end;
end;
WeightChange;
Inc(p);
Inc(Iteraciones);
If p>NumPatternsTraining-1 then
p:=0;
end;
END;

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

49

3.8 CODIFICACION PARA CALCULAR LAS TASAS DE RECONOCIMIENTO Y


ERRORES CUADRATICOS MEDIOS
El software para poder entregar las estadsticas con los porcentajes de las tasas de
reconocimiento y del error cuadrtico medio, debe utilizar el siguiente procedimiento que se
proponen a continuacin y que utiliza el criterio propuesto por R. Lippman (Lippman, 1987).
Este procedimiento calcula el error que se comete por patrn entrenado y determina si puede
ser, o no, considerado un acierto (1) o un rechazo (0). La implementacin del procedimiento
denominado Estadsticas se puede expresar, en Object Pascal, de la siguiente manera:

procedure TFormPrincipal.Estadisticas(var stre,stra:array of real;Numpat,Pt:integer);


var
k,Clase,posmayor:integer;
mayor:real;
BEGIN
Clase:=trunc(Numpat/Pt);
stre[Numpat]:=0;
stra[Numpat]:=0;
mayor:=0;
posmayor:=0;
For k:=0 to M-1 do
begin
stre[Numpat]:=stre[Numpat]+sqr(NOD[k]-NO[k].y);
If NO[k].y>mayor then
begin
mayor:=NO[k].y;
posmayor:=k;
end;
end;
stre[Numpat]:=0.5*stre[Numpat];
If Clase=posmayor then
stra[Numpat]:=1
else
stra[Numpat]:=0;
end;
END;

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

50

El procedimiento Estadsticas requiere de la utilizacin de dos funciones definidas como


mayor y porcentaje, que entregan, respectivamente, la posicin de la componente de
mayor valor del vector de salida de la red neuronal y el porcentaje de las componentes del
vector str a procesar, que puede ser tanto el vector de reconocimiento, como el de errores.

function TFormPrincipal.mayor(strn:array of Neuron):Integer;


var
k,pos:integer;
aux:real;
BEGIN
aux:=0;
pos:=0;
For k:=0 to M-1 do
begin
If strn[k].y>aux then
begin
aux:=strn[k].y;
pos:=k;
end;
end;
result:=pos;
END;
function TFormPrincipal.Porcentaje(str:array of real;Numpat:integer):real;
var
j:integer;
BEGIN
Result:=0;
For j:=0 to Numpat-1 do
Result:=Result+str[j];
Result:=(100/Numpat)*Result;
END;

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

51

CAPITULO IV - METODOLOGIA PARA EL DESARROLLO DE UN


SISTEMA DE RECONOCIMIENTO DE ROSTROS HUMANOS
BASADO EN UNA RED NEURONAL
4.1 INTRODUCCION
Los sistemas de reconocimiento de rostros humanos varan mucho unos de otros, existiendo
varias alternativas (Chellappa et al., 1995; Costen et al., 1996; Dai et al., 1997; Kosko, 1992;
Kosko, 1997; Lawrence et al., 1997; Lee et al., 1996; Lippman, 1987; Liu et al., 2000;
Nsnen, 1999; Purnell et al., 1998) basados en redes neuronales, algoritmos genticos, lgica
difusa o alguna mezcla de ellos (Brunelli et al., 1996; Gmez, 1993; Hu et al., 1999).
En este captulo, se presenta la metodologa y el diseo de experimentos propuestos para el
sistema de reconocimiento desarrollado en este Proyecto y que permite investigar la mejor
arquitectura y configuracin de la red neuronal de retropropagacin, que permita las mximas
tasas de reconocimiento y con mnimo error. Se estudia la mejor resolucin de las imgenes de
entrada a la red neuronal y se varan las cantidades de neuronas ocultas, para obtener el monto
adecuado que permita buenas tasas de reconocimiento.
Se presenta la base de datos utilizada, la conversin de formatos y la forma de particin para
realizar los experimentos. El tipo de reduccin realizada a las imgenes, denominada
Reduccin Piramidal. El mtodo de estiramiento lineal de contraste aplicado a los
histogramas de las imgenes que permite normalizar la iluminacin. Y la forma de realizar los
muestreos de aprendizajes de la red neuronal variando el tamao de las imgenes y la cantidad
de neuronas ocultas, en bsqueda de la mejor arquitectura para la red neuronal.

4.2 SISTEMA DE RECONOCIMIENTO AUTOMATICO DE ROSTROS


4.2.1 Hardware para la implementacin del sistema de reconocimiento
En este Proyecto se puede distinguir, por una parte, el desarrollo terico (Cceres, 2002) y,
por otra, la aplicacin con el fin de disear el sistema de reconocimiento automtico de rostros
humanos y el anlisis de su desempeo.
Es as que la implementacin del sistema de reconocimiento de rostros requiere de ciertos
elementos materiales (hardware), que son los siguientes (Ver Figura 6):
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

52

Cmara de video: equivale a la etapa sensorial y permite la adquisicin de las


imgenes del medioambiente que se desea automatizar.

Tarjeta capturadora de video: permite la captura de las imgenes de video mediante


una conversin (A/D) desde la cmara hacia el computador. Siendo interfaz de
comunicacin entre la cmara y el computador.

Computador: permite manipular las imgenes digitales para hacer mejoras en ellas.
Como tambin, poder almacenar la aplicacin de reconocimiento que realizar el
reconocimiento de rostros.
FIGURA 6
REQUERIMIENTOS DE HARDWARE PARA EL SISTEMA DE
RECONOCIMIENTO AUTOMATICO

El computador, en la actualidad, permite realizar miles de millones de clculos por segundo,


permitiendo entrenar los algoritmos de aprendizaje de los modelos neuronales. Estos
algoritmos son costosos en trminos de procesamiento y consumo de recursos de CPU. El
computador, adems, entrega la capacidad de almacenamiento de grandes cantidades de
imgenes en bases de datos para su posterior recuperacin.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

53

4.2.2 Etapas del sistema de reconocimiento automtico de rostros humanos


El sistema de reconocimiento automtico de rostros se divide, principalmente, en tres etapas
(Ver Figura 7):

Etapa Sensorial: Adquisicin de imgenes

Computador: Captura (Interfaz A/D), Pre-procesamiento (Estiramiento lineal de


contraste) y Clasificador (Red neuronal de Retropropagacin)

Accin: Bsqueda en Base de Datos.


FIGURA 7
ETAPAS DEL SISTEMA DE
RECONOCIMIENTO AUTOMATICO
ADQUISICION DE IMAGENES

CAPTURA

ETAPA
SENSORIAL

INTERFAZ
A/D

PRE-PROCESAMIENTO

ESTIRAMIENTO LINEAL
DE CONTRASTE

CLASIFICADOR

RED NEURONAL DE
RETROPROPAGACION

BUSQUEDA EN BASE DE DATOS

COMPUTADOR

ACCION

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

54

4.3 BASE DE DATOS DE ROSTROS HUMANOS


4.3.1 Introduccin
Para el entrenar y medir el rendimiento de la red neuronal mediante su capacidad de
generalizacin, se utiliza una base de datos estndar que ha sido utilizada por algunos autores
(Lawrence et al., 1997; Dai et al., 1997), conocida como la base de datos ORL, que contiene
un grupo de 400 imgenes de rostros de 40 personas con 10 imgenes diferentes por individuo,
tomadas entre Abril de 1992 y Abril de 1994 en Olivetti Research Laboratory en Cambrige.
Todas las imgenes de la base de datos ORL fueron tomadas en diferentes momentos,
existiendo variaciones en las expresiones faciales: ojos abiertos-cerrados, personas sonriendoserias y con o sin anteojos, con un fondo oscuro y con las personas preferentemente en
posicin frontal, permitiendo una tolerancia de rotacin de aproximadamente 20 grados y con
una variacin en la escala del 10%. Las imgenes estn disponibles en escala de grises con una
resolucin de 92x112 pxeles en formato PGM.
La base de datos ORL puede ser gratuitamente obtenida a travs de Internet en la pgina Web
de Olivetti Research Laboratory en Cambrige: http://www.cam-orl.co.uk/facedatabase.html.
Todas las imgenes de rostros humanos disponibles en la base de datos ORL pueden
apreciarse en detalle en la Figura 8.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

55

FIGURA 8
IMAGENES DE LOS ROSTROS HUMANOS DE LA BASE DE DATOS ORL

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

56

4.3.2 Conversin en el formato de las imgenes


La base de datos de todas las imgenes por estar en formato PGM, tuvieron que ser
convertidas, previamente a su utilizacin, al formato BMP que es un estndar para Windows.
Como la red neuronal necesita procesar los patrones de entrada en forma vectorial, cada
imagen tuvo que ser convertida de este ltimo formato al formato TXT, para poder ser
almacenadas como matrices en archivos de texto, permitiendo as, una fcil manipulacin de
las imgenes. Este procedimiento est asociado al botn (GRISTXT) del programa Sistema
de Captura de Videos e Imgenes (Ver Anexos), cuyo nombre de componente objeto en
Delphi es ButtonConverterGrisClick (Inprise, 2000).
Se utiliza un componente objeto de Delphi denominado OpenDialog y que permite
fcilmente saber si un usuario realiza la accin de abrirlo y ejecutarlo OpenDialog.Execute.
De esta forma, si el dilogo es abierto y ejecutado el programa entonces procede a realizar la
conversin de los formatos esperada. Si no, el algoritmo no realiza la conversin y los
recursos de asignados son liberados mediante las sentencias: CloseFile() y Dispose ()
(Inprise, 2000).
El algoritmo propuesto para la conversin de las imgenes del formato BMP a TXT puede
verse representado, en Object Pascal, en el siguiente procedimiento:

procedure TMainForm.ButtonConverterGrisClick;
var
x, y, Ancho, Alto, FileHandle: integer;
p: PByteArray;
s: boolean;
BEGIN
s:= False;
try
If OpendialogRostroGris.Execute then
begin
New(Ima);
NewBitmap:= TBitmap.Create;
NewBitmap.LoadFromFile(OpenDialogRostroGris.FileName);
BackupName:= ExtractFileName(OpenDialogRostroGris.FileName);
BackupName:= ChangeFileExt(BackupName, '.txt');
FileHandle:= FileCreate(DirTXT+BackupName);
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

57

FileClose(FileHandle);
Ancho:= NewBitmap.Width;
Alto:= NewBitmap.Height;
for y:= 0 to (Alto-1) do
begin
p:= NewBitmap.scanline[y];
for x:= 0 to (Ancho-1) do
Ima^[x+1,y+1]:= p^[x];
end;
AssignFile(Arch,DirTXT+BackupName);
reset(Arch);
Rewrite(Arch);
for y:= 1 to Alto do
begin
for x:= 1 to Ancho do
begin
write(Arch,Ima^[x,y]);
write(Arch,' ');
end;
writeln(Arch);
end;
s:=True;
end;
Finally
If s then
begin
CloseFile(Arch);
NewBitmap.Free;
Dispose(Ima);
end;
end;
END;

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

58

4.3.3 Particiones realizadas en la base de datos ORL


Se realizan dos particiones de la base de datos ORL. En la primera particin, la base de datos
se divide en dos conjuntos: entrenamiento y prueba. En la segunda particin, la base de datos
se divide en tres conjuntos: entrenamiento, validacin y prueba. La red neuronal fue entrenada
con el conjunto de entrenamiento y su capacidad de generalizacin fue medida con el conjunto
de prueba.
En la primera particin, la red fue entrenada con un grupo de 6 imgenes por persona, con un
total de 240 imgenes de entrenamiento, y probada con el conjunto restante, de 4 imgenes por
individuo, con un total 160 imgenes de prueba.
En la segunda particin, la red fue entrenada con un grupo de 4 imgenes por persona, con un
total de 160 imgenes entrenadas, y probada con los dos conjuntos restantes; 3 imgenes por
individuo, con un total 120 imgenes de validacin y 120 imgenes de prueba.
Para poder medir la real capacidad de generalizacin de la red neuronal, se deben utilizar
imgenes que no se hayan empleado en el entrenamiento. Esto permite tener una medida del
desempeo que tendra la red en conjuntos de datos nuevos, los cuales no disponen en la
realidad, debido a que las personas nunca se presentarn de la misma forma en que la red los
aprendi, ya sea en su postura, gesto, iluminacin, heridas y maquillaje facial, corte de pelo,
presencia de barba, bigotes, anteojos o envejecimiento natural.
A modo de ejemplo se muestra para la primera particin realizada los rostros de la primera y
cuarta persona que se utilizaron para entrenar a la red neuronal (Ver Figura 9). Se puede
observar que las primeras 6 imgenes de cada individuo de la Figura 8, fueron utilizadas como
el conjunto correspondiente al entrenamiento y las restantes, 4 imgenes por individuo, fueron
utilizadas como el conjunto correspondiente a la prueba (Ver Figura 10).
Tambin a modo de ejemplo se muestra para la segunda particin realizada los rostros de la
primera y cuarta persona que se utilizaron para entrenar a la red neuronal (Ver Figura 11). Se
puede observar que las primeras 4 imgenes de cada individuo de la Figura 8, fueron utilizadas
como el conjunto correspondiente al entrenamiento y las restantes para validacin y prueba,
donde: 3 imgenes por individuo, fueron utilizadas tanto para el conjunto correspondiente a la
validacin (Ver Figura 12) y como para la prueba (Ver Figura 13).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

59

FIGURA 9
IMAGENES DE ENTRENAMIENTO DE LA PRIMERA Y CUARTA PERSONA
RESPECTIVAMENTE DE LA BASE DE DATOS ORL, DE LA PRIMERA PARTICION

FIGURA 10
IMAGENES DE PRUEBA DE LA PRIMERA Y CUARTA PERSONA RESPECTIVAMENTE
DE LA BASE DE DATOS ORL, DE LA PRIMERA PARTICION

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

60

FIGURA 11
IMAGENES DE ENTRENAMIENTO DE LA PRIMERA Y CUARTA PERSONA RESPECTIVAMENTE
DE LA BASE DE DATOS ORL, DE LA SEGUNDA PARTICION

FIGURA 12
IMAGENES DE VALIDACION DE LA PRIMERA Y CUARTA PERSONA
RESPECTIVAMENTE DE LA BASE DE DATOS ORL, DE LA SEGUNDA PARTICION

FIGURA 13
IMAGENES DE PRUEBA DE LA PRIMERA Y CUARTA PERSONA
RESPECTIVAMENTE DE LA BASE DE DATOS ORL, DE LA SEGUNDA PARTICION

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

61

4.4 REDUCCION PIRAMIDAL


Uno de los objetivos de este Proyecto, es maximizar las tasas de reconocimiento de la red
neuronal, cuando las imgenes utilizadas tanto en el entrenamiento, como en la prueba, son
reducidas en tamao en forma sistemtica mediante la utilizacin de representacin piramidal.
Cualquier mtodo de reduccin, en la resolucin de una imagen, produce prdidas en la
informacin de la imagen. Pero, por otra parte, produce una reduccin considerable del
tamao del vector de entrada a la red (Ver Tabla 2), lo que se traduce directamente en una
optimizacin del modelo, permitindole ser ms eficiente y reduciendo considerablemente los
tiempos de procesamiento necesarios para el aprendizaje.
Como se explic en el Captulo I, se han propuesto diferentes mtodos para reducir el vector
de entrada a la red, mediante extraccin de caractersticas biomtricas del rostro de una
persona, como tambin mediante el anlisis de componentes principales de la matriz que
representa la imagen del rostro a procesar o mediante la aplicacin de diferentes transformadas
en las imgenes como un pre-procesamiento previo al reconocimiento, como la transformada
KL, FFT, entre otras.
El mtodo propuesto para la reduccin de las imgenes es mediante la reduccin piramidal
(Schalkoff, 1989). La forma en que se realiza, en este proyecto, es haciendo un submuestreo
para cada variable x e y de una imagen bidimensional (x,y), con ello, se reduce cada
dimensin de la imagen a la mitad. Esto se traduce directamente en reducir el tamao de una
imagen a la cuarta parte (1/4), en pxeles, lo que significa que en dos procesos consecutivos se
habr logrado una reduccin de un dieciseisavo (1/16) de la imagen original. As,
sucesivamente para (n)-procesos consecutivos, la imagen original quedar reducida a (1/4n)
del tamao original.
Una representacin grfica de la reduccin piramidal, puede verse en la Figura 14. Las
imgenes originales utilizadas son imgenes de tamao de 92x112 pxeles, por tanto, el
nmero de reducciones sucesivas que a lo ms se podrn realizar sern cinco.
Cabe hacer notar, que la ltima reduccin en la Tabla 2, aunque es factible, no se estudia en
este proyecto debido principalmente a que la reduccin penltima de 5x7 pxeles, ya produce
una disminuciones grotesca y obvia en las tasas de reconocimiento (Ver Captulo V), lo que
hace que la reduccin de 2x3 no merezca un estudio formal y fuese omitida.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

62

En la Tabla 2 se muestra la reduccin empleada, la resolucin de las imgenes en pxeles y el


tamao del vector de entrada que se genera para la red neuronal.
TABLA 2
REDUCCION PIRAMIDAL DE LAS IMAGENES EN PIXELES Y DEL
TAMAO DEL VECTOR DE ENTRADA A LA RED NEURONAL
PROCESOS DE
REDUCCIONES
CONSECUTIVAS

TIPO DE
REDUCCION
EMPLEADA

0
1
2
3
4
5

Ninguna
1/4
1/16
1/64
1/256
1/1024

FORMATO DE LAS
IMAGENES
RESULTANTES
[PIXELES]
92x112
46x56
23x28
11x14
5x7
2x3

TAMAO DEL VECTOR


DE ENTRADA A LA
RED NEURONAL
10304
2576
644
154
35
6

FIGURA 14
EFECTOS DE LA REDUCCION PIRAMIDAL.
(A) MUESTRA EL EFECTO TEORICO EN LA REDUCCION DE LOS PIXELES. (B)
MUESTRA EL EFECTO DIRECTO EN UNA IMAGEN DE LA BASE DE DATOS ORL

5x7 Pixeles
4
11x14 Pixeles
3
23x28 Pixeles

2
46x56 Pixeles

92x112 Pixeles

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

63

4.5 ESTIRAMIENTO LINEAL DE CONTRASTE


La variacin de la iluminacin en las imgenes es un hecho que afecta en los sistemas de
reconocimiento (Gmez, 1993; Gonzlez et al., 1996; Jain, 1989). Para abordar este
inconveniente, una forma puede ser mediante la implementacin en ambientes controlados, en
los cuales la cantidad de luz y el tipo de iluminacin permanece constante. Tambin, pueden
utilizarse cmaras sofisticadas cuyos diafragmas se abren y cierran automticamente
dependiendo de la cantidad de luz presente en el medio ambiente, tendiendo a homogeneizar
la variaciones de iluminacin. Otra forma, puede ser mediante el entrenamiento de la red con
imgenes que posean diferentes cantidades de iluminacin.
En este Proyecto, se implementa un pre-procesamiento de las imgenes, por software, previo
al reconocimiento y que consiste en un estiramiento lineal de contraste de los histogramas de
las imgenes a ser entrenadas (Ajenjo, 1993; Gmez, 1993; Gonzlez et al., 1996; Jain, 1989).
Para ello, todas las imgenes a procesar son normalizadas utilizando esta metodologa.
Las imgenes estn codificadas en escala de grises de 8 bits y, por lo tanto, pueden
representarse 256 niveles de gris en el intervalo [0, 255], donde el 0 representa al negro y el
255 representa al blanco. Los 254 nmeros enteros intermedios restantes, representan los
posibles tonos de grises codificados entre el negro y el blanco que el computador puede
entregar. El estiramiento lineal de contraste aplicado al histograma original de las imgenes,
permite normalizar los niveles de gris en todas las imgenes utilizadas.
La formulacin matemtica para el estiramiento lineal de contraste t aplicado a cada pxel de
una imagen puede verse en forma escalar en las Ecuaciones 4.1 y 4.2 y que, adems, es
representado en el Grfico 1. La variable u representa el nivel de gris de cada pxel de la
matriz U (Imagen Original) y la variable v representa el nivel de gris modificado de cada
pxel de la matriz V (Imagen Modificada).
Sea:
v = t (u )

v = mt (u - u1)

(4.1)
(4.2)

Donde:
(u1 , v1) = ( Mn , 0)
(u 2 , v 2) = ( Mx , 255)
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

64

mt =

255
( Mx. Mn.)

El estiramiento lineal propuesto puede verse en forma vectorial en las Ecuaciones 4.3 y 4.4,
transformacin lineal T aplicada a toda una matriz (imagen).
V = T (U )

(4.3)

V = ml [U u1 A]

(4.4)

Donde:

A = (aij ) = 1 ; i, j
GRAFICO 1
REPRESENTACION DEL ESTIRAMIENTO LINEAL
ALICADO A CADA PIXEL DE UNA IMAGEN

v = t (u )
(u1 , v1)

(u 2 , v 2)
u

En la Figura 15 se ilustra el efecto del estiramiento lineal. La Figura 15A muestra una imagen
original de un rostro de la base de datos ORL versus la modificada mediante la transformacin
lineal aplicada a su histograma, Figura 15B.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

65

FIGURA 15
ESTIRAMIENTO LINEAL DE CONTRASTE (ELC) EN IMAGENES
(A) IMAGEN SIN ELC. (B) IMAGEN CON ELC.

En los Grficos 2A y 2B se muestran los histogramas correspondiente a las imgenes de la


Figura 15A y 15B, respectivamente. Adems, se puede notar claramente la modificacin que
sufre el histograma a causa del estiramiento lineal de contraste.
Se observa que el histograma original (Ver Grfico 2A) slo alcanza hasta el nivel de gris 210
y posteriormente a su estiramiento (Ver Grfico 2B) logr alcanzar hasta el nivel de gris 255.
Esto, en forma prctica, caus en la imagen un aumento del contraste (Ver Figura 15B)
permitiendo una mejora en la definicin del rostro que estaba levemente oscuro originalmente
(Ver Figura 15A)..
GRAFICO 2
ESTIRAMIENTO LINEAL DE CONTRASTE (ELC) EN HISTOGRAMAS (H).
(A) H. DE LA FIGURA 15(A) SIN ELC, MEDIDO EN NUMERO DE PIXELES/TOTAL EN
FUNCION DE LOS NIVELES DE GRIS. (B) H. DE LA FIGURA 15(B) CON ELC

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

66

4.6 APRENDIZAJES DE LA RED NEURONAL VARIANDO EL TAMAO DE LAS


IMAGENES Y LA CANTIDAD DE NEURONAS OCULTAS
4.6.1 Introduccin
Uno de los objetivos de este Proyecto es determinar tanto la resolucin adecuada de la imagen
de entrada a la red, o sea, el nmero de neuronas de entrada adecuado, como tambin, el
nmero adecuado de neuronas ocultas, en bsqueda de la mejor arquitectura y configuracin,
que permita las mximas tasas de reconocimiento de rostros humanos y con mnimas tasas de
error, en forma eficaz y eficiente. Esto implica entrenar y medir las capacidades de
generalizacin de la red neuronal. Para ello, se dise una serie de experimentos utilizando las
particiones hechas a la base de datos ORL (Ver Seccin 4.3.3).

4.6.2 Forma de realizacin de las muestras


Los algoritmos de entrenamiento para redes neuronales requieren de gran cantidad de tiempo
de proceso, que depende fuertemente del nmero de neuronas y, por tanto, de la cantidad de
pesos que posea la red. Por una parte, el nmero de neuronas depende de la resolucin de las
imgenes de entrada a la red y, por otra, de la cantidad de neuronas ocultas y de salida. Otro
factor que influye en el tiempo de proceso, es la rapidez de la CPU del computador donde se
ejecutan los procesos. Estos se realizaron inicialmente en un Pentium III de 450 Mhz, 128 MB
de RAM y se finalizaron en un Pentium III de 1.0 Ghz, 256 MB de RAM.
Se realiz una serie de muestreos de los procesos de aprendizajes de la red neuronal con
diferentes arquitecturas e inicializando aleatoriamente, en cada muestra, el aprendizaje para
evitar posibles mnimos locales. Se registr, para cada proceso, cada poca del entrenamiento
almacenando las tasas de reconocimientos (TR) y con sus respectivos errores cuadrticos
medios (ECM). Todas las muestras fueron tomadas con los parmetros de entrenamiento
constantes, que fueron ajustados empricamente para lograr una buena convergencia.
Los parmetros de entrenamiento para la red neuronal de retropropagacin fueron fijados en:

Learning Rate= 0,26

Momentum= 0,12

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

67

A. Primera particin de la base de datos ORL


La primera particin consta de dos conjuntos: entrenamiento y prueba (Ver Seccin 4.3.3).
Para cada proceso se escogi la mejor TR y el mejor ECM medido en el conjunto de prueba de
la base de datos ORL. Se utiliz la reduccin piramidal en todas las imgenes, tanto durante
los entrenamientos como en las pruebas. De esta manera se logr determinar el nmero de
pocas de entrenamiento en forma emprica, que permitiera las mximas tasas de
reconocimiento para cada proceso, y que depende de la resolucin de la imagen de entrada a la
red, como tambin de su arquitectura.
Se tomaron ocho muestras consecutivas con inicializaciones de pesos aleatorias para cada
muestra. Para cada ciclo, de ocho muestras, se vari la arquitectura de la red neuronal,
modificando el nmero de neuronas de entradas en: 10.304, 2.576, 644, 154 y 35, de acuerdo
con la Tabla 2. Adems, para cada uno de estos cinco casos, se vari el nmero de neuronas
ocultas en: 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 y 100. De estos experimentos, se obtienen
cinco curvas con valores medios correspondiente a la TR obtenida por la red neuronal,
denominada tasa media de reconocimiento (TMR) y cinco curvas con valores medios
correspondiente al ECM cometido por la red, denominado promedio del error cuadrtico
medio (PECM), cada una de estas diez curvas se obtienen con sus respectivas desviaciones
estndares.
Con este mtodo, se pretende determinar la mejor arquitectura y configuracin para la red
neuronal, como tambin, la resolucin adecuada de la imgenes para la base de datos de
entrenamiento y prueba en la primera particin. La importancia de ello radica en que se
presenta un mtodo para determinar el mejor modelo neuronal para realizar reconocimiento de
rostros humanos.
Una vez obtenidas todas las muestras, se requiere determinar la mejor red neuronal de
reconocimiento para cada uno de los cinco casos de la representacin piramidal. Para ello, se
someti a un Test Estadstico las medias obtenidas de cada una de las ocho muestras, para
cada caso en que se varan la cantidad de neuronas ocultas y para cada reduccin de imagen.
Se utiliz un Test Estadstico de comparacin de medias para muestras reducidas, StudentFisher (Mothes, 1961) (Ver Ecuacin 4.6). Estas comparaciones se realizaron utilizando el
programa MATLAB versin 6.0 Statistics Toolbox (MathWorks, 2000d).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

68

Para hacer las comparaciones de las medias para obtener los mejores casos de los cinco casos
estudiados, se crea la tabla de comparacin matricial (Ver Tabla 3) que permite saber todos los
casos posibles que sern sometidos a Test.
TABLA 3
COMPARACIONES ENTRE REDES
NEURONALES CON DIFERENTES CANTIDAD
DE NEURONAS OCULTAS. COMPARA (1), NO COMPARA (0)
NEURONAS
OCULTAS
1

10

20

30

40

50

60

70

80

90

100

1
0

10

1
0

20

1
0

30

1
0

40

50

60

70

80

90

100

1
0

1
0

1
0

1
0

1
0

1
0

1
0

Sean las muestras X e Y, muestras sometidas a Test, donde existe la media de la muestra X
(mx) y la media de la muestra Y (my). Se realiza la dcima de hiptesis (H0) de la manera
planteada en la Ecuacin 4.5.
H o : mx = m y

(4.5)

Donde:
0: La hiptesis nula (H0) es rechazada, pudiendo ser cierta (Error Tipo 1).
1: La hiptesis nula es aceptada, pudiendo ser falsa (Error Tipo 2).
Para cada dcima de hiptesis realizada se utilizan los siguientes parmetros:

Significancia: mxima probabilidad del Error Tipo 1 que se puede cometer con un
ensayo muestral representado por la hiptesis nula. Es el valor de probabilidad
asociado con la Estadstica T (Ver Ecuacin 4.6).

Intervalo de Confianza: Representa el intervalo en que se encuentra la verdadera


diferencia entre las medias probadas con una probabilidad del 95%.

: Permite el control del nivel de significancia y del intervalo de confianza. Si = 0,05


el error aceptado es de un 5%, lo que implica que el Intervalo de Confianza posee una

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

69

probabilidad de certeza de un [100*(1-)] [%] (95%) para la verdadera diferencia en


las medias. En este trabajo se utiliza el valor de =0,05.
__

__

XY
T=
1 1
s
+
n m

(4.6)

s: representa las desviaciones estndar de las muestras. Las variables n y m


representan el nmero de muestras en cada observacin de las muestras X e Y, que
respectivamente en este proyecto son iguales y de tamao ocho, o sea: n = m = 8.

Una vez realizadas todas las dcimas de hiptesis, para todas las comparaciones posibles, se
determinan los cinco mejores arquitecturas para la red neuronal que permite una mxima tasa
de reconocimiento. Con estas cinco arquitecturas obtenidas, se debe seleccionar el mejor caso.
Para ello, se vuelven a someter a un Test Estadstico las medias obtenidas de cada uno de los
cinco mejores casos y se vuelve por tanto a realizar una dcima de hiptesis.
Dado los cinco casos estudiados de resolucin piramidal, existirn 10 comparaciones para
todos los casos posibles, que permitir, a su vez, determinar el mejor caso para la arquitectura
de la red neuronal. Para ello se desarrolla la tabla matricial de comparacin (Ver Tabla 4) y
que permite buscar todos los casos sin repeticin.
TABLA 4
COMPARACIONES ENTRE
REDES NEURONALES CON DIFERENTES
ARQUITECTURAS. COMPARA (1) Y NO COMPARA (0)
RESOLUCION
IMAGEN
[PIXELES]

92x112

46x56

92x112

46x56

1
0

23x28
11x14

0
0

5x7

23x28

11x14

5x7

0
0

1
0
0

1
0

1
1
0

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

70

B. Segunda particin de la base de datos ORL


La segunda particin consta de tres conjuntos: entrenamiento, validacin y prueba (Ver
Seccin 4.3.3). Para realizar los experimentos con esta segunda particin, se utilizan las cinco
mejores arquitecturas de la red neuronal determinadas previamente con los experimentos
desarrollados con la primera particin, por tanto, se utiliza el mejor nmero de neuronas
ocultas obtenidas para estas cinco arquitecturas. Adems, se requiere de la reduccin piramidal
en todas las imgenes, tanto durante los entrenamientos como en la validacin y la prueba.
El motivo de esta segunda particin, es debido a que la determinacin de la mejor poca de
entrenamiento, con la primera particin, es determinada mediante la mejor tasa
reconocimiento obtenida en el conjunto de prueba, que obviamente, la red neuronal jams
aprendi en su etapa de entrenamiento. A pesar de ello, se puede pensar que la mejor poca
determinada para entrenamiento est ajustada al conjunto de prueba. Por este motivo, se crea
esta segunda particin que utiliza tres conjuntos, para as poder tener un conjunto que sea
totalmente independiente en la determinacin de las mejores tasas de reconocimiento que la
red neuronal obtendr al ser sometida a clasificar un conjunto de prueba que no se dispone en
la vida real.
En los cinco casos entrenados con la segunda particin, se escoge la poca de entrenamiento,
donde se registra la mejor TR y el mejor ECM medido en el conjunto de validacin y para
dicha poca, se registra el valor de la TR y del ECM en el conjunto de prueba, que en este caso
ser el conjunto independiente. De esta manera se logra determinar el nmero de pocas de
entrenamiento en forma emprica y que permita las mximas tasas de reconocimiento para
cada proceso con esta segunda particin.
Se tomaron ocho muestras consecutivas con inicializaciones de pesos aleatorias para cada
muestra utilizando la segunda particin. Para cada ciclo, de ocho muestras, se vara la
arquitectura de la red neuronal, modificando el nmero de neuronas de entradas en: 10.304,
2.576, 644, 154 y 35 correspondiente a la Tabla 2. Con estas ochos muestras por cada una de
las cinco arquitecturas utilizadas, se determina la TMR y PECM con sus respectivas
desviaciones estndares.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

71

CAPITULO V - RESULTADOS

5.1 INTRODUCCION
En este captulo, se muestran los resultados de todos los experimentos realizados con la red
neuronal de Retropropagacin. Los resultados de los experimentos se presentan en el mismo
orden descrito en la metodologa (Ver Captulo IV).
Se presentan los resultados de aprendizaje de la red neuronal variando el tamao de las
imgenes de entrada y la cantidad de neuronas ocultas para la primera particin realizada en la
base de datos ORL. Se muestrean ocho repeticiones con inicializaciones de pesos aleatorias,
de donde se obtienen los resultados de las tasas medias de reconocimiento de rostros humanos
y de sus respectivos promedios de los errores cuadrticos medios, tomados del conjunto de
prueba. Se presentan los resultados de los Tests Estadsticos, que permitieron obtener las
mejores arquitecturas para la red neuronal, de cada uno de los cinco casos estudiados, con
respecto a la resolucin de la imagen de entrada, y la cantidad de neuronas ocultas. Con esto
se concluye las cinco mejores arquitecturas para la red neuronal, para los cinco diferentes
tamaos de imgenes de entrada. Con esta informacin se obtiene la mejor arquitectura de red
neuronal que permite en forma eficaz y eficiente el reconocimiento de rostros humanos, para
la primera particin, con mxima tasa media de reconocimiento y mnimo promedio de los
errores cuadrticos medios.
Se presentan los resultados utilizando la segunda particin, se muestran los resultados de las
ocho repeticiones consecutivas de aprendizajes, con inicializacin de pesos aleatorias, para las
cinco mejores arquitecturas de la red neuronal determinadas con la primera particin. En cada
repeticin, se registra la mejor poca donde se obtuvo las mejores tasas de reconocimiento y
de errores cuadrticos medios, medidos en el conjunto de validacin. Para dicha poca,
anlogamente, se registran las mejores tasas de reconocimiento y de errores cuadrticos
medios medidas en los conjuntos de entrenamiento y prueba. Con estas ocho muestras de
repeticiones de aprendizajes para cada una de las cinco arquitecturas utilizadas, se determinan
las tasas medias de reconocimiento y el promedio de los errores cuadrticos medios, con sus
respectivas desviaciones.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

72

5.2 MUESTRAS DE APRENDIZAJES DE LA RED NEURONAL VARIANDO EL


TAMAO DE LAS IMAGENES Y LA CANTIDAD DE NEURONAS OCULTAS CON
LA PRIMERA PARTICION
Cada experimento se repiti ocho veces consecutivas para inicializaciones aleatorias de pesos
diferentes para evitar mnimos locales.
En las Tablas 5 a 9 se muestran los resultados de los muestreos de los cinco casos diferentes
correspondientes a las reducciones piramidales hechas sobre las imgenes.
La Tabla 5 corresponde a entrenamientos con las imgenes originales sin reduccin piramidal
(92x112 pxeles). La red neuronal para estos entrenamientos tiene 10.304 neuronas de entrada
y la cantidad de neuronas ocultas vara de 1-100. Se muestran los resultados para el conjunto
de entrenamiento y prueba, de acuerdo a la primera particin hecha. Los resultados mostrados
corresponden al mejor caso obtenido en el conjunto de prueba, donde se registr el valor
correspondiente a la poca de entrenamiento y los valores de las tasas de reconocimiento (TR)
y los errores cuadrticos medios (ECM) que la red obtuvo en dicha poca.
Anlogamente, las Tablas 6, 7, 8 y 9 muestran los mismos resultados que la Tabla 5, pero para
diferentes reducciones piramidales hechas sobre las imgenes, por tanto, con diferentes
cantidades de neuronas de entrada y variando de igual forma la cantidad de neuronas ocultas
de 1-100. Respectivamente, dichas reducciones corresponden a: 46x56, 23x28, 11x14 y 5x7
pxeles. Adems, se utilizaron diferente cantidad de neuronas de entradas que respectivamente
son: 2.576, 644, 154 y 35.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

73

TABLA 5
ENTRENAMIENTOS DE LA RED NEURONAL VARIANDO EL NUMERO DE
NEURONAS OCULTAS (NH). IMAGENES DE 92x112 PIXELES. SE PRESENTAN LAS
TASAS DE RECONOCIMIENTOS (TR) Y LOS ERRORES CUADRATICOS MEDIOS (ECM)
NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
1
800
0,00
48,77
1
600
0,00
48,77
1
397
4,58
47,08
1
400
0,00
48,77
1
2
0,42
52,01
1
1
2,92
94,32
1
1
1,67
90,48
1
279
5,42
47,36

PRUEBA
TR ECM
[%]
[%]
2,50 48,75
2,50 48,75
7,50 48,02
2,50 48,75
2,50 50,65
2,50 54,20
2,50 54,13
10,63 47,67

NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
50 198
100
0,20
50 175
100
0,29
50 155
100
0,36
50 239
100
0,14
50 163
100
0,38
50 189
100
0,26
50 190
100
0,21
50 185
100
0,26

PRUEBA
TR ECM
[%]
[%]
93,13 10,09
93,75 9,35
94,38 10,51
94,38 9,13
94,38 10,90
95,63 10,14
93,75 9,88
93,13 10,18

5
5
5
5
5
5
5
5

992
988
1.000
992
1.217
1.052
1.121
1.125

32,92
51,25
36,25
17,08
70,00
32,08
62,08
62,50

38,42
32,93
37,85
42,75
27,22
39,55
28,61
28,22

25,00
33,13
22,50
18,13
41,88
32,50
47,50
44,38

42,83
42,40
44,78
43,86
39,40
42,26
36,88
39,71

60
60
60
60
60
60
60
60

194
167
196
234
145
163
193
196

100
100
100
100
100
100
100
100

0,17
0,25
0,20
0,12
0,37
0,25
0,15
0,16

95,63
94,38
94,38
95,00
93,13
92,50
95,63
95,63

9,02
9,34
9,91
8,51
10,39
10,72
8,87
9,16

10
10
10
10
10
10
10
10

800
750
800
643
755
798
816
788

100
98,75
99,16
100
99,58
100
100
100

0,40
1,37
0,92
0,83
0,62
0,56
1,09
0,25

68,75
63,75
70,63
66,25
68,75
55,00
46,25
67,50

24,04
27,15
24,61
29,12
25,34
34,89
38,78
24,35

70
70
70
70
70
70
70
70

140
140
237
173
209
191
158
175

100
100
100
100
100
100
100
100

0,27
0,33
0,11
0,20
0,14
0,15
0,24
0,17

94,38
93,80
95,00
95,63
95,00
95,63
96,88
94,38

9,62
10,36
9,40
8,80
8,56
8,91
9,49
9,78

20
20
20
20
20
20
20
20

309
442
448
387
466
446
409
458

100
100
100
100
100
100
100
100

0,32
0,19
0,22
0,18
0,18
0,15
0,22
0,12

86,88
89,38
84,38
89,38
82,50
83,75
83,13
88,75

12,31
14,16
15,42
11,73
14,26
14,02
14,07
12,72

80
80
80
80
80
80
80
80

155
140
120
160
139
154
166
162

100
100
100
100
100
100
100
100

0,20
0,25
0,39
0,19
0,29
0,19
0,17
0,20

96,88
94,38
95,00
95,63
93,13
95,00
95,63
95,00

8,75
10,01
10,37
8,44
9,62
9,48
8,58
9,35

30
30
30
30
30
30
30
30

255
300
352
330
241
256
299
280

100
100
100
100
100
100
100
100

0,25
0,18
0,13
0,14
0,27
0,22
0,18
0.28

90,63
92,50
94,38
90,00
93,13
89,38
91,88
90,00

12,31
10,08
10,15
10,71
10,68
10,88
11,53
12,62

90
90
90
90
90
90
90
90

161
161
202
140
139
163
140
124

100
100
100
100
100
100
100
100

0,18
0,16
0,14
0,25
0,23
0,17
0,22
0,28

95,63
96,25
93,75
95,00
94,38
93,13
93,13
96,25

8,84
8,67
9,51
9,65
9,20
10,48
10,53
10,13

40
40
40
40
40
40
40
40

244
220
254
181
238
259
229
210

100
100
100
100
100
100
100
100

0,23
0,27
0,15
0,30
0,22
0,15
0,20
0,23

90,63
93,75
93,75
91,88
92,50
92,50
91,88
95,00

11,38
9,56
9,36
10,77
9,87
9,73
10,82
10, 17

100
100
100
100
100
100
100
100

182
127
126
167
134
188
149
120

100
100
100
100
100
100
100
100

0,13
0,24
0,22
0,14
0,25
0,13
0,18
0,28

94,38
92,50
95,00
96,88
95,63
96,25
93,13
94,38

9,44
9,82
9,42
8,08
9,42
8,43
9,06
9,33

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

74

TABLA 6
ENTRENAMIENTOS DE LA RED NEURONAL VARIANDO EL NUMERO DE
NEURONAS OCULTAS (NH). IMAGENES DE 46x56 PIXELES. SE PRESENTAN LAS
TASAS DE RECONOCIMIENTOS (TR) Y LOS ERRORES CUADRATICOS MEDIOS (ECM)
NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
1
900
3,75
47,66
1
977
3,33
47,77
1
1.000
0,00
48,77
1
758
2,08
48,75
1
1
2,50
94,27
1
1
3,75
92,73
1
5
0,00
49,26
1
740
1,67
48,77

PRUEBA
TR ECM
[%]
[%]
8,13 48,20
5,63 48,15
2,50 48,75
4,38 48,73
2,50 54,20
2,50 54,13
2,50 49,13
3,75 48,75

NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
50 183
100
0,37
50 290
100
0,21
50 130
100
0,96
50 226
100
0,24
50 179
100
0,41
50 164
100
0,45
50 201
100
0,34
50 158
100
0,62

PRUEBA
TR ECM
[%]
[%]
96,25 9,23
95,63 8,02
96,88 10,45
92,50 8,93
95,00 9,04
95,63 8,75
93,75 8,87
96,88 9,43

5
5
5
5
5
5
5
5

996
700
1.000
631
912
915
980
802

66,25
81,67
62,50
60,42
67,92
85,00
65,83
56,67

30,68
20,13
30,68
29,47
30,68
18,88
30,19
32,96

36,25
53,13
30,00
36,88
38,13
39,38
32,50
35,63

42,54
35,62
47,67
44,07
42,67
53,59
42,58
43,20

60
60
60
60
60
60
60
60

160
163
192
155
148
162
130
130

100
100
100
100
100
100
100
100

0,48
0,45
0,32
0,61
0,58
0,46
0,77
0,77

94,38
96,25
95,63
94,38
94,38
95,00
94,38
95,00

9,34
9,39
8,61
9,78
10,47
9,28
11,23
10,31

10
10
10
10
10
10
10
10

700
786
533
942
897
822
975
710

99,58
100
99,17
100
100
100
99,58
100

0,56
0,35
1,71
0,21
0,18
0,26
0,65
0,45

78,13
80,00
71,88
76,25
82,50
81,25
67,50
78,75

18,66
17,66
24,90
20,34
17,54
16,17
23,94
19,41

70
70
70
70
70
70
70
70

220
175
143
131
140
149
181
214

100
100
100
100
100
100
100
100

0,21
0,28
0,49
0,67
0,74
0,47
0,28
0,20

96,25
95,00
97,50
95,00
95,00
93,13
96,88
96,25

8,29
8,63
9,40
10,07
10,08
9,93
7,88
7,57

20
20
20
20
20
20
20
20

326
360
376
375
376
312
360
385

100
100
100
100
100
100
100
100

0,45
0,34
0,27
0,29
0,39
0,45
0,28
0,27

90,00
90,63
93,75
92,50
89,38
94,38
91,25
91,25

10,32
12,28
10,15
9,16
11,35
9,24
10,39
10,92

80
80
80
80
80
80
80
80

188
186
156
160
117
129
127
116

100
100
100
100
100
100
100
100

0,26
0,29
0,51
0,35
0,70
0,57
0,58
0,70

96,88
95,63
96,25
95,63
96,25
94,38
95,63
94,38

9,04
8,95
9,16
9,08
9,73
9,99
9,80
10,71

30
30
30
30
30
30
30
30

257
369
233
250
235
261
199
237

100
100
100
100
100
100
100
100

0,32
0,16
0,43
0,38
0,39
0,37
0,59
0,38

94,38
95,63
96,88
94,38
95,63
93,75
94,38
94,38

9,42
8,64
9,25
9,56
8,77
9,91
9,69
8,61

90
90
90
90
90
90
90
90

149
239
134
149
127
165
150
142

100
100
100
100
100
100
100
100

0,38
0,15
0,49
0,36
0,53
0,29
0,36
0,40

95,00
95,63
95,00
95,63
96,25
96,25
95,63
96,25

9,63
7,87
9,89
8,89
9,35
9,31
10,04
8,65

40
40
40
40
40
40
40
40

320
246
245
205
235
193
243
161

100
100
100
100
100
100
100
100

0,16
0,27
0,25
0,41
0,27
0,43
0,27
0,68

96,88
95,00
93,75
94,38
94,38
95,63
95,00
95,63

8,45
8,77
9,66
9,34
9,26
8,82
8,97
9,18

100
100
100
100
100
100
100
100

129
241
206
199
247
149
121
187

100
100
100
100
100
100
100
100

0,50
0,14
0,17
0,19
0,13
0,35
0,58
0,21

94,38
96,88
95,63
95,63
96,88
95,00
94,38
95,00

9,90
8,02
8,42
9,53
8,.44
9,14
9,75
8,77

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

75

TABLA 7
ENTRENAMIENTOS DE LA RED NEURONAL VARIANDO EL NUMERO DE
NEURONAS OCULTAS (NH). IMAGENES DE 23x28 PIXELES. SE PRESENTAN LAS
TASAS DE RECONOCIMIENTOS (TR) Y LOS ERRORES CUADRATICOS MEDIOS (ECM)
NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
1
1.000
0,00
48,77
1
971
2,50
48,76
1
999
0,00
48,77
1
1.000
1,67
48,77
1
1
4,17
98,80
1
1
2,50
98,70
1
852
4,58
47,47
1
5
0,00
49,26

PRUEBA
TR ECM
[%]
[%]
2,50 48,75
2,50 48,74
2.50 48,75
1,88 48,75
2,50 54,35
2,50 54,25
7,50 47,61
5,00 49,12

NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
50 202
100
1,14
50 182
100
1,32
50 187
100
1,15
50 224
100
0,68
50 227
100
0,64
50 177
100
1,56
50 230
100
0,66
50 217
100
0,80

PRUEBA
TR ECM
[%]
[%]
95,00 10,73
96,25 10,93
95,63 11,37
95,63 8,94
94,38 9,32
95,63 11,10
96,25 9,07
96,88 9,50

5
5
5
5
5
5
5
5

608
942
832
899
967
844
784
929

87,50
81,67
75,42
78,33
91,25
89,17
36,67
50,00

16,99
17,67
21,82
19,07
11,19
15,84
37,46
31,99

49,38
59,38
52,50
54,38
53,75
56,88
25,00
42,50

38,11
35,18
34,65
34,73
39,75
40,16
43,47
36,94

60
60
60
60
60
60
60
60

230
188
234
212
196
190
197
198

100
100
100
100
100
100
100
100

0,57
1,08
0,54
0,68
0,79
1,00
0,84
0,86

95,63
96,25
95,63
95,00
95,00
95,00
96,88
93,75

8,68
10,92
8,25
9,03
9,32
1052
9,05
10,33

10
10
10
10
10
10
10
10

665
510
572
555
640
583
503
659

100
99,58
98,75
99,17
100
99,17
99,17
100

0,65
1,42
1,52
1,40
0,68
1,43
1,50
1,19

85,00
90,63
85,63
88,13
85,63
87,50
90,63
87,50

15,75
14,85
14,81
14,44
14,73
14,16
13,62
15,17

70
70
70
70
70
70
70
70

185
195
159
202
198
194
182
153

100
100
100
100
100
100
100
100

0,94
0,81
1,23
0,70
0,81
0,85
0,99
1,61

96,88
96,25
96,88
95,00
95,63
97,50
96,88
95,63

9,94
9,36
10,48
9,30
9,39
9,69
10,16
11,36

20
20
20
20
20
20
20
20

338
321
320
387
351
371
325
375

100
100
100
100
100
100
100
100

0,69
0,87
0,85
0,60
0,57
0,64
0,75
0,58

95,00
93,75
95,00
94,38
94,38
93,75
96,25
95,63

10,22
11,38
8,83
9,63
9,47
9,27
9,48
9,29

80
80
80
80
80
80
80
80

162
160
173
223
195
191
175
178

100
100
100
100
100
100
100
100

1,19
1,22
0,93
0,50
0,73
0,73
0,93
0,91

96,25
95,63
96,25
95,00
96,25
97,50
95,63
96,25

11,14
10,73
10,05
9,03
9,25
9,24
9,92
9,54

30
30
30
30
30
30
30
30

217
250
243
265
247
236
212
269

100
100
100
100
100
100
100
100

1,45
0,89
1,21
0,81
1,03
1,08
1,68
0,71

93,75
96,25
95,63
96,25
93,13
95,00
94,38
95,63

11,39
9,88
10,09
9,35
10,79
9,20
11,09
9,88

90
90
90
90
90
90
90
90

245
174
208
197
197
219
157
226

100
100
100
100
100
100
100
100

0,40
0,90
0,54
0,69
0,59
0,48
1,16
0,45

95,00
95,00
95,00
97,50
96,88
95,00
96,25
95,00

8,97
9,83
9,06
9,46
9,03
9,45
10,95
9,35

40
40
40
40
40
40
40
40

239
259
215
202
256
202
198
208

100
100
100
100
100
100
100
100

0,75
0,62
1,00
1,26
0,64
1,27
1,47
1,23

95,63
95,63
95,00
96,25
96,25
96,25
95,00
95,00

9,96
8,77
9,51
10,09
8,86
10,44
10,16
10,14

100
100
100
100
100
100
100
100

235
174
174
174
173
238
213
168

100
100
100
100
100
100
100
100

0,38
0,79
0,83
0,92
0,85
0,37
0,49
0,93

95,63
96,88
96,88
96,25
96,25
96,25
96,25
95,00

8,92
10,13
9,97
10,00
9,75
8,41
9,21
10,77

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

76

TABLA 8
ENTRENAMIENTOS DE LA RED NEURONAL VARIANDO EL NUMERO DE
NEURONAS OCULTAS (NH). IMAGENES DE 11x14 PIXELES. SE PRESENTAN LAS
TASAS DE RECONOCIMIENTOS (TR) Y LOS ERRORES CUADRATICOS MEDIOS (ECM)
NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
1
1.359
4,17
47,48
1
6
0,00
49,10
1
2
0,00
52,04
1
870
0,83
48,77
1
3
0,00
50,20
1
2
0,00
52,06
1
1
4,17
50,0
1
4
0,00
49,55

PRUEBA
TR ECM
[%]
[%]
6,25 47,83
2,50 49,01
2,50 50,66
2,50 48,75
5,00 49,74
4,38 50,67
2,50 54,64
5,00 49,33

NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
50 419
100
0,97
50 370
100
1,42
50 417
100
0,83
50 362
100
1,72
50 380
100
1,21
50 380
100
1,16
50 438
100
0,87
50 400
100
1,19

PRUEBA
TR ECM
[%]
[%]
93,13 10,95
92,50 12,73
93,75 11,72
93,75 12,98
90,63 12,31
91,88 12,14
93,13 11,80
93,13 12,07

5
5
5
5
5
5
5
5

1.350
838
1.838
1.933
1.747
1.281
2.170
1.044

57,08
100
95,42
95,83
84,58
89,58
97,08
90,00

30,92
1,45
7,02
6,08
16,60
12,17
6,04
14,86

37,50
86,25
70,00
68,13
58,75
70,63
65,00
65,63

39,93
16,43
33,09
32,90
35,99
32,79
36,68
29,98

60
60
60
60
60
60
60
60

410
441
389
375
360
370
372
440

100
100
100
100
100
100
100
100

0,81
0,69
0,92
1,14
1,34
1,03
1,16
0,65

92,50
92,50
93,13
91,25
91,25
91,88
92,50
92,50

11,71
11,01
11,80
12,15
12,09
11,63
11,91
10,51

10
10
10
10
10
10
10
10

708
826
750
826
841
903
977
778

100
100
100
100
99,58
100
100
99,58

2,48
1,37
1,78
1,37
1,33
1,03
0,80
1,81

85,63
86,25
86,25
86,25
89,38
89,38
79,38
85,63

16,04
15,11
15,49
15,11
15,42
14,10
17,88
16,41

70
70
70
70
70
70
70
70

368
426
407
432
358
415
380
318

100
100
100
100
100
100
100
100

1,12
0,66
0,77
0,67
1,19
0,75
0,97
1,82

94,38
93,13
91,88
93,13
93,13
93,75
91,88
91,25

11,52
11,00
11,79
11,28
12,25
11,62
11,98
13,55

20
20
20
20
20
20
20
20

434
548
554
501
454
541
543
492

100
100
100
100
100
100
100
100

2,60
1,07
2,20
1,63
2,34
1,17
1,05
1,95

89,38
93,13
90,63
91,25
90,00
91,25
92,50
91,25

14,32
12,17
12,44
13,35
13,87
12,81
12,17
14,32

80
80
80
80
80
80
80
80

364
457
400
379
419
440
371
378

100
100
100
100
100
100
100
100

0,94
0,57
0,75
0,82
0,65
0,55
1,00
0,90

93,13
91,88
91,88
92,50
93,13
92,50
92,50
93,75

11,71
10,93
11,46
11,44
10,97
11,30
12,31
11,72

30
30
30
30
30
30
30
30

444
442
433
453
409
465
498
450

100
100
100
100
100
100
100
100

1,32
1,27
1,46
1,25
1,77
1,04
0,82
1,11

92,50
92,50
92,50
90,00
90,63
91,25
92,50
92,50

12,54
11,70
11,86
12,77
13,14
11,20
10,82
12,02

90
90
90
90
90
90
90
90

292
318
447
349
395
356
398
411

100
100
100
100
100
100
100
100

1,87
1,47
0,53
0,99
0,71
0,93
0,71
0,62

91,25
91,88
93,75
93,13
91,25
91,88
92,50
91,88

13,85
13,63
10,83
12,20
11,26
11,70
11,45
11,44

40
40
40
40
40
40
40
40

443
451
418
429
408
380
337
392

100
100
100
100
100
100
100
100

0,95
1,01
1,06
0,96
1,14
1,80
2,49
1,61

91,25
91,88
93,13
91,25
95,00
93,13
93,13
94,38

11,50
11,12
12,59
11,75
11,48
13,16
14,25
13,02

100
100
100
100
100
100
100
100

317
383
305
398
372
371
358
398

100
100
100
100
100
100
100
100

1,32
0,77
1,49
0,71
0,79
0,82
0,84
0,67

91,25
91,25
91,25
92,50
92,50
91,88
92,50
93,75

13,40
11,50
14,20
11,20
11,69
11,73
11,45
11,12

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

77

TABLA 9
ENTRENAMIENTOS DE LA RED NEURONAL VARIANDO EL NUMERO DE
NEURONAS OCULTAS (NH). IMAGENES DE 5x7 PIXELES. SE PRESENTAN LAS
TASAS DE RECONOCIMIENTOS (TR) Y LOS ERRORES CUADRATICOS MEDIOS (ECM)
NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
1
2.939
0,83
48.77
1
2.619
0,42
48.77
1
2.868
2,50
48.76
1
1.949
5,00
48.06
1
1
2,50
99.91
1
1
3,33
97.00
1
1
3,33
95.66
1
3.039
5,00
47.39

PRUEBA
TR ECM
[%]
[%]
2,50 48,75
2,50 48,75
2,50 48,74
6,88 48,21
2,50 54,32
2,50 54,41
2,50 54,31
6,25 47,71

NH EPOCA ENTRENAMIENTO
TR
ECM
[%]
[%]
50 1.100
99,17
1,88
50 1.140
99,58
1,60
50 928
98,33
3,59
50 1.174
99,17
1,86
50 834
97,50
4,79
50 1.456
99,17
1,09
50 1.336
98,75
1,37
50 1.150
99,17
1,80

PRUEBA
TR ECM
[%]
[%]
74,38 23,63
75,63 23,80
75,00 24,90
73,13 23,62
71,88 26,36
76,25 23,12
72,50 23,38
73,13 23,76

5
5
5
5
5
5
5
5

3.468
2.822
2.431
2.090
2.027
2.180
2.116
1.863

84,58
80,00
78,75
78,75
78,33
82,08
74,17
74,58

16.38
17.87
20.26
21.41
21.69
19.52
20.22
22.81

47,50
58,75
54,38
48,13
51,88
60,63
60,63
58,13

41,80
36,72
37,09
38,22
36,34
33,91
33,62
35,78

60
60
60
60
60
60
60
60

1.128
996
1.098
1.253
1.256
1.594
1.481
1.233

98,75
99,17
99,17
99,17
99,58
99,17
98,75
99,58

1,79
2,44
2,01
1,38
1,09
0,84
1,17
1,16

71,88
74,38
71,88
75,63
75,00
73,75
73,75
78,75

24,80
24,15
24,67
23,56
23,04
23,20
23,28
22,87

10
10
10
10
10
10
10
10

1.354
1.263
1.529
1.294
1.719
1.204
1.687
1.099

94,17
92,92
95,42
88,33
94,58
90,42
92,92
89,58

8.58
10.99
6.68
10.72
5.65
12.50
6.95
12.71

63,13
71,25
65,63
66,25
66,88
67,50
68,13
67,50

29,32
26,20
28,52
27,50
27,25
29,29
28,50
29,03

70
70
70
70
70
70
70
70

1.191
1.065
989
1.300
1.622
1.462
1.780
1.308

99,58
99,58
99,58
99,17
99,17
99,17
99,58
99,58

1,33
1,72
2,24
1,16
0,82
0,90
0,54
0,96

75,63
74,38
73,75
74,38
76,88
75,00
77,50
74,38

23,22
23,64
24,87
23,88
22,70
23,51
22,44
23,86

20
20
20
20
20
20
20
20

1.152
1.253
1.270
1.248
1.673
1.731
1.734
1.074

97,50
97,50
97,50
97,50
97,92
98,75
98,75
97,08

4.25
3.32
3.41
3.56
1.98
1.50
1.24
5.02

73,13
72,50
75,00
74,38
73,13
75,00
73,13
72,50

25,51
23,58
23,56
24,39
23,32
21,72
21,76
24,64

80
80
80
80
80
80
80
80

1.249
881
1.228
1.247
1.719
1.565
1.331
1.788

99,58
99,17
99,58
99,17
99,58
99,58
99,58
99,58

1,14
2,98
1,09
1,18
0,53
0,64
0,86
0,51

75,63
72,50
73,75
75,00
76,88
77,50
75,63
75,00

22,51
26,07
23,53
23,35
22,96
22,52
22,98
23,36

30
30
30
30
30
30
30
30

1.191
1.183
1.062
1.385
1.203
1.399
1.308
1.077

98,75
98,75
97,50
99,17
98,33
98,75
98,75
98,75

2.70
2.40
3.89
1.46
2.47
1.52
1.84
3.04

74,38
73,75
74,38
72,50
74,38
71,88
72,50
73,13

24,74
23,48
24,64
24,29
22,33
23,63
24,46
24,42

90
90
90
90
90
90
90
90

1.029
947
1.070
1.077
1.446
1.482
956
1.441

99,58
99,58
99,58
99,58
99,58
99,58
99,17
99,58

1,70
2,23
1,58
1,63
0,71
0,69
2,31
0,70

73,13
76,25
72,50
73,75
76,25
75,63
73,13
75,63

24,39
24,89
24,21
23,97
22,77
23,50
25,10
22,86

40
40
40
40
40
40
40
40

1.125
956
1.245
1.258
1.007
903
946
1.353

98,75
98,75
98,75
98,75
98,75
98,33
98,75
98,75

2.10
3.63
1.64
1.57
2.87
4.35
3.61
1.40

74,38
75,00
75,63
77,50
71,88
75,63
76,25
77,50

24,79
24,20
22,79
22,30
25,10
25,02
24,54
22,77

100
100
100
100
100
100
100
100

1.282
1.300
1.107
1.008
1.579
1.527
1.699
1.335

99,58
99,58
99,58
99,58
99,58
99,58
99,58
99,58

0,93
0,90
1,32
1,81
0,58
0,62
0,52
0,.81

75,63
75,63
73,13
72,50
75,00
76,88
76,88
75,63

23,77
23,74
23,88
24,88
23,18
22,78
22,72
23,72

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

78

5.3 RESULTADOS PROMEDIOS DE RECONOCIMIENTOS DE ROSTROS


HUMANOS PARA DIFERENTES RESOLUCIONES DE LAS IMAGENES DE
ENTRADA Y DE LA CANTIDAD DE NEURONAS OCULTAS CON LA PRIMERA
PARTICION
A partir de los valores mximos en el reconocimiento de rostros humanos para las ocho
repeticiones con inicializaciones diferentes y aleatorias de la Seccin 5.2, se calcularon las
medias y desviaciones de las tasas de reconocimiento y de los errores cuadrticos medios,
donde se grafic estos resultados. En las Tablas 10 a 14 y Grficos 3 a 12, pueden verse
representadas las tasas medias de reconocimiento (TMR) y los promedios de los errores
cuadrticos medios (PECM), con sus respectivas desviaciones, para cada uno de los cinco
casos estudiados de reduccin de imagen y para diferente cantidad de neuronas ocultas. Estos
grficos estn expresados en porcentaje y todos en funcin de la cantidad de neuronas ocultas.
Estos resultados representan el comportamiento promedio de la red neuronal para las
diferentes cantidades de neuronas ocultas y de entrada.
Se puede observar, segn las curvas de los Grficos 3 a 12, que entre menor es el nmero de
neuronas ocultas que posee la red, menor es su capacidad de reconocimiento de rostros y
mayor es el error y la varianza. Por otra parte, entre ms neuronas ocultas posee el modelo,
mejora considerablemente su capacidad de reconocimiento y disminuye el error y la varianza.
Se observa, adems, que un nmero excesivo de neuronas no mejora el rendimiento del
modelo e inclusive puede llegar a empeorarlo en algunos casos.
TABLA 10
TASA MEDIA DE RECONOCIMIENTO (TMR)
Y PROMEDIOS DE LOS ERRORES CUADRATICOS MEDIOS (PECM)
CON SUS RESPECTIVAS DESVIACIONES, EN EL CONJUNTO DE PRUEBA,
DE LA TABLA 5. IMAGENES DE 92x112 PIXELES
NEURONAS
OCULTAS
1
5
10
20
30
40
50
60
70
80
90
100

PRUEBA
TMR
[%]

4,14
33,13
63,36
86,02
91,48
92,73
94,06
94,53
95,08
95,08
94,69
94,77

TMR
[%]
3,15
10,78
8,44
2,91
1,77
1,38
0,82
1,19
0,97
1,08
1,29
1,49

PECM
[%]
50,11
41,51
28,54
13,58
11,12
10,21
10,02
9,49
9,36
9,33
9,63
9,12

PECM
[%]
2,65
2,63
5,49
1,22
0,95
0,71
0,58
0,78
0,59
0,69
0,71
0,58

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

79

GRAFICO 3
TASA MEDIA DE RECONOCIMIENTO
CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 92x112 PIXELES

GRAFICO 4
PROMEDIO DEL ERROR CUADRATICO
MEDIO CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE LA CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 92x112 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

80

TABLA 11
TASA MEDIA DE RECONOCIMIENTO (TMR)
Y PROMEDIOS DE LOS ERRORES CUADRATICOS MEDIOS (PECM)
CON SUS RESPECTIVAS DESVIACIONES, EN EL CONJUNTO DE PRUEBA,
DE LA TABLA 6. IMAGENES DE 46x56 PIXELES
NEURONAS
OCULTAS
1
5
10
20
30
40
50
60
70
80
90
100

TMR
[%]

3,98
37,73
77,03
91,64
94,92
95,08
95,31
94,92
95,63
95,63
95,70
95,47

PRUEBA
PECM
TMR
[%]
[%]
2,03
50,01
6,91
43,99
5,05
19,83
1,77
10,47
1,03
9,23
0,97
9,06
1,53
9,09
0,70
9,80
1,38
8,98
0,88
9,56
0,52
9,20
0,99
9,00

PECM
[%]
2,59
5,10
3,11
1,04
0,50
0,38
0,69
0,83
1,02
0,61
0,71
0,69

GRAFICO 5
TASA MEDIA DE RECONOCIMIENTO
CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 46X56 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

81

GRAFICO 6
PROMEDIO DEL ERROR CUADRATICO
MEDIO CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE LA CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 46x56 PIXELES

TABLA 12
TASA MEDIA DE RECONOCIMIENTO (TMR)
Y PROMEDIOS DE LOS ERRORES CUADRATICOS MEDIOS (PECM)
CON SUS RESPECTIVAS DESVIACIONES, EN EL CONJUNTO DE PRUEBA,
DE LA TABLA 7. IMAGENES DE 23x28 PIXELES
NEURONAS
OCULTAS
1
5
10
20
30
40
50
60
70
80
90
100

TMR
[%]

3,36
49,22
87,58
94,77
95,00
95,63
95,70
95,39
96,33
96,09
95,70
96,17

PRUEBA
PECM
[%]
[%]
1,92
50,0
11,03
37,87
2,18
14,69
0,88
9,70
1,16
10,21
0,58
9,74
0,78
10,12
0,94
9,51
0,85
9,96
0,73
9,86
1,03
9,51
0,62
9,64

TMR

PECM
[%]
2,67
3,13
0,64
0,79
0,80
0,63
1,01
0,96
0,71
0,75
0,65
0,75

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

82

GRAFICO 7
TASA MEDIA DE RECONOCIMIENTO
CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 23x28 PIXELES

GRAFICO 8
PROMEDIO DEL ERROR CUADRATICO
MEDIO CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE LA CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 23x28 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

83

TABLA 13
TASA MEDIA DE RECONOCIMIENTO (TMR)
Y PROMEDIOS DE LOS ERRORES CUADRATICOS MEDIOS (PECM)
CON SUS RESPECTIVAS DESVIACIONES, EN EL CONJUNTO DE PRUEBA,
DE LA TABLA 8. IMAGENES DE 11x14 PIXELES
NEURONAS
PRUEBA
PECM
OCULTAS
TMR
TMR
PECM
[%]
[%]
[%]
[%]
1
5
10
20
30
40
50
60
70
80
90
100

3,83
65,23
86,02
91,17
91,80
92,89
92,73
92,19
92,81
92,66
92,19
92,11

1,51
13,70
3,10
1,23
1,03
1,38
1,05
0,67
1,06
0,65
0,88
0,88

50,08
32,23
15,70
13,18
12,01
12,36
12,09
11,60
11,87
11,48
12,04
12,04

2,07
7,06
1,12
0,91
0,79
1,08
0,63
0,56
0,78
0,45
1,12
1,13

GRAFICO 9
TASA MEDIA DE RECONOCIMIENTO
CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 11x14 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

84

GRAFICO 10
PROMEDIO DEL ERROR CUADRATICO
MEDIO CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE LA CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 11x14 PIXELES

TABLA 14
TASA MEDIA DE RECONOCIMIENTO (TMR) Y
PROMEDIOS DE LOS ERRORES CUADRATICOS MEDIOS (PECM)
CON SUS RESPECTIVAS DESVIACIONES, EN EL CONJUNTO DE PRUEBA,
DE LA TABLA 9. IMAGENES DE 5x7 PIXELES
NEURONAS
OCULTAS
1
5
10
20
30
40
50
60
70
80
90
100

TMR
[%]

3,52
55,00
67,03
73,59
73,36
75,47
73,98
74,38
75,23
75,23
74,53
75,16

PRUEBA
PECM
[%]
[%]
1,89
50,65
5,36
36,69
2,31
28,20
1,04
23,56
1,00
24,00
1,82
23,94
1,57
24,07
2,22
23,70
1,33
23,51
1,60
23,41
1,56
23,96
1,59
23,58

TMR

PECM
[%]
3,08
2,58
1,12
1,33
0,81
1,14
1,06
0,75
0,76
1,14
0,87
0,70

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

85

GRAFICO 11
TASA MEDIA DE RECONOCIMIENTO
CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 5x7 PIXELES

GRAFICO 12
PROMEDIO ERROR CUADRATICO
MEDIO CON SUS RESPECTIVAS DESVIACIONES EN
FUNCION DE LA CANTIDAD DE NEURONAS OCULTAS, PARA
UNA RED NEURONAL CON IMAGEN DE ENTRADA DE 5x7 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

86

5.4 RESULTADOS DE TEST ESTADISTICOS PARA DETERMINACION DE LAS


MEJORES

ARQUITECTURAS

DE

LA

RED

NEURONAL

PARA

RECONOCIMIENTO DE ROSTROS CON LA PRIMERA PARTICION


Para determinar el mejor caso de reconocimiento de rostros es necesario comparar medias con
sus desviaciones. Para esto se someten a Test Estadstico que permita determinar si las
diferencias entre medias son o no significativas. La importancia de esto radica en que si las
medias son equivalentes para distintas cantidades de neuronas ocultas, conviene seleccionar el
modelo que utilice menor cantidad de neuronas ocultas, porque se logra los mismos resultados
con menores recursos de memoria, de CPU y de tiempos de proceso.
En las Tablas 15 a 19 se pueden ver todos los casos que se sometieron a prueba, para cada uno
de los cinco casos que se estudian de reducciones de imgenes.
TABLA 15
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS OCULTAS
(NH) SOMETIDOS A TEST, PARA IMAGENES DE 92x112 PIXELES
NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
1-5
0
3,92e-4
[-37,50 -20,46]
1-10
0
2,90e-9
[-66,05 -52,38]
1-20
0
0
[-85,12 -78,62]
1-30
0
0
[-90,08 -84,60]
1-40
0
0
[-91,20 -85,98]
1-50
0
0
[-92,39 -87,45]
1-60
0
0
[-92,94 -87,83]
1-70
0
0
[-93,43 -88,43]
1-80
0
0
[-93,46 -88,41]
1-90
0
0
[-93,12 -87,96]
1-100
0
0
[-93,26 -87,98]
5-10
0
2,15e-3
[-40,62 -19,84]
5-20
0
2,25e-7
[-61,36 -44,42]
5-30
0
4,63e-8
[-66,64 -50,07]
5-40
0
3,27e-8
[-67,85 -51,36]
5-50
0
2,27e-8
[-69,13 -52,73]
5-60
0
2,14e-8
[-69,63 -53,17]
5-70
0
1,85e-8
[-70,16 -53,74]
5-80
0
1,87e-8
[-70,17 -53,73]
5-90
0
2,104e-8
[-69,79 -53,32]
5-100
0
2,134e-8
[-69,89 -53,38]
10-20
0
4,75e-4
[-29,42 -15,88]
10-30
0
2,52e-5
[-34,66 -21,58]
10-40
0
1,34e-5
[-35,86 -22,88]
10-50
0
6,99e-6
[-37,13 -24,26]
10-60
0
6,17e-6
[-37,63 -24,70]
10-70
0
4,76e-6
[-38,16 -25,27]
10-80
0
4,86e-6
[-38,17 -25,26]
10-90
0
5,93e-6
[-37,80 -24,84]
10-100 0
6,02e-6
[-37,90 -24,90]
20-30
0
4,59e-2
[-8,05 -2,88]
20-40
0
3,85e-3
[-9,16 -4,27]
20-50
0
2,76e-4
[-10,34 -5,75]

NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
20-60
0
2,27e-4
[-10,90 -6,12]
20-70
0
8,25e-5
[-11,38 -6,73]
20-80
0
9,47e-5
[-11,41 -6,70]
20-90
0
2,13e-4
[-11,08 -6,25]
20-100 0
2,60e-4
[-11,23 -6,26]
30-40
1
13,65
[-2,94 0,44]
30-50
0
0,22
[-4,05 -1,10]
30-60
0
0,12
[-4,66 -1,43]
30-70
0
1,79e-2
[-5,12 -2,06]
30-80
0
2,29e-2
[-5,16 -2,02]
30-90
0
0,10
[-4,86 -1,54]
30-100 0
0,13
[-5,03 -1,52]
40-50
0
3,41
[-2,54 -0,11]
40-60
0
1,44
[-3,17 -0,41]
40-70
0
0,15
[-3,61 -1,06]
40-80
0
0,20
[-3,66 -1,01]
40-90
0
1,11
[-3,38 -0,52]
40-100 0
1,33
[-3,56 -0,49]
50-60
1
37,49
[-1,56 0,62]
50-70
0
4,01
[-1,97 -0,05]
50-80
1
5,23
[-2,04 0,01]
50-90
1
26,75
[-1,78 0,53]
50-100 1
26,20
[-1,99 0,58]
60-70
1
33,15
[-1,71 0,61]
60-80
1
35,26
[-1,76 0,67]
60-90
1
80,54
[-1,49 1,17]
60-100 1
73,37
[-1,68 1,21]
70-80
1
100
[-1,10 1,10]
70-90
1
50,57
[-0,83 1,61]
70-100 1
62,71
[-1,03 1,66]
80-90
1
52,26
[-0,88 1,66]
80-100 1
63,86
[-1,08 1,70]
90-100 1
91,25
[-1,57 1,41]

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

87

TABLA 16
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS OCULTAS
(NH) SOMETIDOS A TEST, PARA IMAGENES DE 46x56 PIXELES
NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
1-5
0
2,58e-7
[-39,21 -28,28]
1-10
0
1,55e-13
[-77,17 -68,91]
1-20
0
0
[-89,69 -85,61]
1-30
0
0
[-92,66 -89,21]
1-40
0
0
[-92,80 -89,38]
1-50
0
0
[-93,25 -89,39]
1-60
0
0
[-92,56 -89,30]
1-70
0
0
[-93,50 -89,78]
1-80
0
0
[-93,31 -89,96]
1-90
0
0
[-93,30 -90,12]
1-100
0
0
[-93,19 -89,77]
5-10
0
3,38e-7
[-45,78 -32,80]
5-20
0
4,35e-10
[-59,31 -48,49]
5-30
0
1,46e-10
[-62,48 -51,88]
5-40
0
1,39e-10
[-62,63 -52,05]
5-50
0
1,59e-10
[-62,94 -52,21]
5-60
0
1,35e-10
[-62,45 -51,91]
5-70
0
1,39e-10
[-63,23 -52,54]
5-80
0
1,19e-10
[-63,17 -52,60]
5-90
0
1,09e-10
[-63,22 -52,71]
5-100
0
1,27e-10
[-63,02 -52,44]
10-20
0
2,06e-4
[-18,66 -10,55]
10-30
0
1,17e-5
[-21,80 -13,98]
10-40
0
1,03e-5
[-21,94 -14,14]
10-50
0
1,20e-5
[-22,28 -14,27]
10-60
0
1,03e-5
[-21,75 -14,02]
10-70
0
8,86e-6
[-22,56 -14,62]
10-80
0
6,85e-6
[-22,48 -14,70]
10-90
0
5,75e-6
[-22,52 -14,82]
10-100 0
7,96e-6
[-22,34 -14,53]
20-30
0
4,58e-2
[-4,83 -1,73]
20-40
0
2,69e-2
[-4,96 -1,90]
20-50
0
5,55e-2
[-5,44 -1,89]

NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
20-60
0
2,42e-2
[-4,72 -1,83]
20-70
0
1,83e-2
[-5,68 -2,28]
20-80
0
5,41e-3
[-5,48 -2,48]
20-90
0
2,16e-3
[-5,45 -2,66]
20-100 0
1,02e-2
[-5,36 -2,29]
30-40
1
75,90
[-1,22 0,91]
30-50
1
55,84
[-1,78 1,00]
30-60
1
100
[-0,94 0,94]
30-70
1
26,63
[-2,00 0,59]
30-80
1
16,41
[-1,73 0,32]
30-90
1
7,55
[-1,65 0,09]
30-100 1
29,60
[-1,62 0,53]
40-50
1
72,00
[-1,60 1,14]
40-60
1
71,79
[-0,75 1,06]
40-70
1
37,42
[-1,82 0,73]
40-80
1
25,83
[-1,54 0,44]
40-90
1
13,09
[-1,46 0,21]
40-100 1
43,84
[-1,44 0,65]
50-60
1
52,26
[-0,88 1,66]
50-70
1
67,43
[-1,87 1,24]
50-80
1
62,48
[-1,65 1,02]
50-90
1
50,57
[-1,61 0,83]
50-100 1
81,19
[-1,53 1,22]
60-70
1
21,94
[-1,87 0,46]
60-80
1
10,02
[-1,55 0,15]
60-90
0
2,44
[-1,44 -0,11]
60-100 1
22,31
[-1,46 0,37]
70-80
1
100
[-1,24 1,24]
70-90
1
88,29
[-1,19 1,03]
70-100 1
79,81
[-1,12 1,44]
80-90
1
83,26
[-0,85 0,70]
80-100 1
74,38
[-0,84 1,16]
90-100 1
56,25
[-0,61 1,08]

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

88

TABLA 17
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS OCULTAS
(NH) SOMETIDOS A TEST, PARA IMAGENES DE 23x28 PIXELES
NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
1-5
0
1,46e-6
[-54,34 -37,37]
1-10
0
0
[-86,41 -82,01]
1-20
0
0
[-93,00 -89,80]
1-30
0
0
[-93,33 -89,94]
1-40
0
0
[-93,78 -90,74]
1-50
0
0
[-93,91 -90,77]
1-60
0
0
[-93,65 -90,41]
1-70
0
0
[-94,55 -91,37]
1-80
0
0
[-94,28 -91,17]
1-90
0
0
[-93,99 -90,69]
1-100
0
0
[-94,34 -91,28]
5-10
0
1,44e-5
[-46,88 -29,83]
5-20
0
1,37e-6
[-53,93 -37,15]
5-30
0
1,32e-6
[-54,18 -37,37]
5-40
0
1,05e-6
[-54,78 -38,03]
5-50
0
1,05e-6
[-54,86 -38,10]
5-60
0
1,16e-6
[-54,56 -37,77]
5-70
0
8,89e-7
[-55,49 -38,72]
5-80
0
9,39e-7
[-55,55 -38,49]
5-90
0
1,07e-6
[-54,88 -38,08]
5-100
0
9,12e-7
[-55,32 -38,57]
10-20
0
5,37e-5
[-8,96 -5,40]
10-30
0
6,56e-5
[-9,29 -5,55]
10-40
0
8,18e-6
[-9,75 -6,33]
10-50
0
1,00e-5
[-9,87 -6,37]
10-60
0
2,22e-5
[-9,61 -6,01]
10-70
0
4,53e-6
[-10,52 -6,97]
10-80
0
5,11e-6
[-10,25 -6,77]
10-90
0
1,64e-5
[-9,94 -6,30]
10-100 0
3,82e-6
[-10,30 -6,87]
20-30
1
65,54
[-1,33 0,86]
20-40
0
3,68
[-1,65 -0,06]
20-50
0
4,06
[-1,82 -0,04]

NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
20-60
1
19,17
[-1,60 0,35]
20-70
0
0,28
[-2,48 -0,63]
20-80
0
0,54
[-2,19 -0,46]
20-90
1
7,00
[-1,96 0,08]
20-100 0
0,24
[-2,22 -0,59]
30-40
1
19,34
[-1,60 0,35]
30-50
1
17,59
[-1,76 0,35]
30-60
1
47,11
[-1,52 0,74]
30-70
0
2,02
[-2,41 -0,24]
30-80
0
4,01
[-2,13 -0,05]
30-90
1
21,94
[-1,87 0,46]
30-100 0
2,43
[-2,16 -0,17]
40-50
1
82,32
[-0,81 0,65]
40-60
1
55,81
[-0,60 1,07]
40-70
1
7,31
[-1,48 0,07]
40-80
1
17,59
[-1,17 0,23]
40-90
1
85,39
[-0,97 0,81]
40-100 1
8,94
[-1,18 0,09]
50-60
1
48,13
[-0,61 1,23]
50-70
1
14,69
[-1,49 0,24]
50-80
1
31,77
[-1,19 0,41]
50-90
1
0
[-0,97 0,97]
50-100 1
20,41
[-1,22 0,28]
60-70
1
5,50
[-1,89 0,02]
60-80
1
11,69
[-1,60 0,19]
60-90
1
53,58
[-1,36 0,74]
60-100 1
7,01
[-1,63 0,07]
70-80
1
56,25
[-0,61 1,08]
70-90
1
20,54
[-0,38 1,63]
70-100 1
68,02
[-0,63 0,95]
80-90
1
39,48
[-0,56 1,34]
80-100 1
82,05
[-0,80 0,64]
90-100 1
28,74
[-1,37 0,44]

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

89

TABLA 18
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS OCULTAS
(NH) SOMETIDOS A TEST, PARA IMAGENES DE 11x14 PIXELES
NH EN H0 SIGNIFICANCIA INTEVALO DE
TEST
[%]
CONFIANZA
1-5
0
4,96e-7
[-71,85 -50,95]
1-10
0
0
[-84,80 -79,57]
1-20
0
0
[-88,81 -85,86]
1-30
0
0
[-89,35 -86,58]
1-40
0
0
[-90,61 -87,51]
1-50
0
0
[-90,30 -87,51]
1-60
0
0
[-89,61 -87,10]
1-70
0
0
[-90,38 -87,58]
1-80
0
0
[-90,07 -87,58]
1-90
0
0
[-89,68 -87,03]
1-100
0
0
[-89,60 -86,95]
5-10
0
9,15e-2
[-31,42 -10,13]
5-20
0
1,05e-2
[-36,36 -15,50]
5-30
0
8,25e-3
[-36,97 -16,14]
5-40
0
5,65e-3
[-38,09 -17,21]
5-50
0
5,86e-3
[-37,91 -17,08]
5-60
0
7,03e-3
[-37,35 -16,55]
5-70
0
5,70e-3
[-37,99 -17,16]
5-80
0
5,92e-3
[-37,81 -17,02]
5-90
0
7,10e-3
[-37,36 -16,54]
5-100
0
7,30e-3
[-37,28 -16,46]
10-20
0
6,29e-2
[-7,68 -2,3]
10-30
0
1,90e-2
[-8,25 -3,0]
10-40
0
5,12e-3
[-9,44 -4,30]
10-50
0
4,52e-3
[-9,19 -4,23]
10-60
0
7,68e-3
[-8,57 -3,76]
10-70
0
4,03e-3
[-9,27 -4,31]
10-80
0
3,63e-3
[-9,03 -4,24]
10-90
0
9,02e-3
[-8,61 -3,72]
10-100 0
1,01e-2
[-8,53 -3,65]
20-30
1
28,72
[-1,83 0,58]
20-40
0
1,94
[-3,11 -0,32]
20-50
0
1,61
[-2,78 -0,33]

NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
20-60
1
5,86
[-2,07 0,04]
20-70
0
1,24
[-2,86 -0,41]
20-80
0
0,90
[-2,53 -0,43]
20-90
1
7,79
[-2,16 0,12]
20-100 1
10,05
[-2,08 0,20]
30-40
1
9,29
[-2,39 0,20]
30-50
1
9,29
[-2,05 0,17]
30-60
1
38,22
[-1,31 0,53]
30-70
1
7,14
[-2,13 0,10]
30-80
1
6,49
[-1,77 0,06]
30-90
1
42,83
[-1,41 0,63]
30-100 1
52,38
[-1,33 0,71]
40-50
1
80,23
[-1,15 1,46]
40-60
1
21,43
[-0,45 1,86]
40-70
1
90,04
[-1,23 1,39]
40-80
1
66,93
[-0,91 1,38]
40-90
1
24,38
[-0,53 1,94]
40-100 1
19,73
[-0,45 2,01]
50-60
1
23,53
[-0,39 1,49]
50-70
1
88,43
[-1,20 1,05]
50-80
1
86,07
[-0,85 1,01]
50-90
1
27,95
[-0,49 1,58]
50-100 1
21,86
[-0,41 1,66]
60-70
1
17,92
[-1,57 0,32]
60-80
1
17,59
[-1,17 0,23]
60-90
1
100
[-0,84 0,84]
60-100 1
84,44
[-0,75 0,91]
70-80
1
72,66
[-0,78 1,09]
70-90
1
22,02
[-0,41 1,66]
70-100 1
17,01
[-0,33 1,74]
80-90
1
24,62
[-0,36 1,29]
80-100 1
17,86
[-0,28 1,37]
90-100 1
86,19
[-0,86 1,02]

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

90

TABLA 19
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS OCULTAS
(NH) SOMETIDOS A TEST, PARA IMAGENES DE 5x7 PIXELES
NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
1-5
0
3,61e-11
[-55,79 -47,17]
1-10
0
0
[-65,77 -61,25]
1-20
0
0
[-71,71 -68,44]
1-30
0
0
[-71,46 -68,22]
1-40
0
0
[-73,94 -69,96]
1-50
0
0
[-72,32 -68,60]
1-60
0
0
[-73,06 -68,65]
1-70
0
0
[-73,47 -69,96]
1-80
0
0
[-73,59 -69,84]
1-90
0
0
[-72,87 -69,15]
1-100
0
0
[-73,51 -69,76]
5-10
0
4,33e-3
[-16,45 -7,60]
5-20
0
1,47e-5
[-22,73 -14,45]
5-30
0
1,68e-5
[-22,49 -14,22]
5-40
0
7,01e-6
[-24,75 -16,17]
5-50
0
1,49e-5
[-23,21 -14,75]
5-60
0
1,86e-5
[-23,77 -14,97]
5-70
0
5,94e-6
[-24,41 -16,04]
5-80
0
6,96e-6
[-24,47 -15,99]
5-90
0
1,05e-5
[-23,76 -15,30]
5-100
0
7,27e-6
[-24,39 -15,91]
10-20
0
3,74e-4
[-8,48 -4,64]
10-30
0
5,20e-4
[-8,23 -4,42]
10-40
0
1,16e-4
[-10,66 -6,20]
10-50
0
5,75e-4
[-9,06 -4,83]
10-60
0
1,42e-3
[-9,77 -4,91]
10-70
0
5,07e-5
[-10,22 -6,18]
10-80
0
9,41e-5
[-10,33 -6,07]
10-90
0
2,41e-4
[-9,61 -5,38]
10-100 0
1,03e-4
[-10,25 -5,99]
20-30
1
65,33
[-0,86 1,32]
20-40
0
2,42
[-3,46 -0,28]
20-50
1
56,62
[-1,81 1,03]

NH EN H0 SIGNIFICANCIA INTERVALO DE
TEST
[%]
CONFIANZA
20-60
1
38,22
[-2,63 1,07]
20-70
0
1,59
[-2,92 -0,35]
20-80
0
2,92
[-3,08 -0,19]
20-90
1
17,92
[-2,35 0,48]
20-100 0
3,59
[-3,00 -0,11]
30-40
0
1,23
[-3,68 -0,53]
30-50
1
35,71
[-2,03 0,78]
30-60
1
25,70
[-2,85 0,82]
30-70
0
0,66
[-3,13 -0,61]
30-80
0
1,39
[-3,30 -0,44]
30-90
1
9,49
[-2,57 0,23]
30-100 0
1,72
[-3,22 -0,37]
40-50
1
10,23
[-0,33 3,30]
40-60
1
29,91
[-1,08 3,26]
40-70
1
77,34
[-1,47 1,94]
40-80
1
78,86
[-1,60 2,07]
40-90
1
28,74
[-0,88 2,75]
40-100 1
72,05
[-1,52 2,14]
50-60
1
69,00
[-2,44 1,66]
50-70
1
10,75
[-2,80 0,30]
50-80
1
13,65
[-2,94 0,44]
50-90
1
49,51
[-2,22 1,12]
50-100 1
15,99
[-2,86 0,52]
60-70
1
36,33
[-2,82 1,10]
60-80
1
38,89
[-2,93 1,21]
60-90
1
87,27
[-2,21 1,89]
60-100 1
43,17
[-2,85 1,28]
70-80
1
100
[-1,57 1,57]
70-90
1
34,87
[-0,85 2,25]
70-100 1
91,68
[-1,49 1,65]
80-90
1
38,82
[-0,99 2,39]
80-100 1
92,34
[-1,63 1,79]
90-100 1
44,09
[-2,31 1,06]

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

91

Con las pruebas descritas en esta seccin, se puede concluir las cinco mejores arquitecturas
para la red neuronal de retropropagacin que permite reconocer rostros, obtenindose el
desempeo del sistema con las cinco diferentes representaciones piramidales en la imgenes
utilizadas.
El primer mejor caso, corresponde a una red neuronal con resolucin de imagen de entrada de
92x112 pxeles, con 10.304 neuronas de entrada y 60 neuronas ocultas, que alcanz una tasa
media de reconocimiento del 94,53% con una desviacin estndar del 1,19% y un promedio
del error cuadrtico medio del 9,49% con una desviacin estndar del 0,78%. El segundo caso,
corresponde una red neuronal con resolucin de imagen de entrada de 46x56 pxeles, con
2.576 neuronas de entrada y 30 neuronas ocultas, que alcanz una tasa media de
reconocimiento del 94,92% con una desviacin estndar del 1,03% y un promedio del error
cuadrtico medio del 9,23% con una desviacin estndar del 0,50%. El tercer caso,
corresponde a una red neuronal con resolucin de imagen de entrada de 23x28 pxeles, con
644 neuronas de entrada y 40 neuronas ocultas, que alcanz una tasa media de reconocimiento
del 95,63% con una desviacin estndar del 0,58% y un promedio del error cuadrtico medio
del 9,74% con una desviacin estndar del 0,63%. El cuarto caso, corresponde a una red
neuronal con resolucin de imagen de entrada de 11x14 pxeles, con 154 neuronas de entrada
y 30 neuronas ocultas, que alcanz una tasa media de reconocimiento del 91,80% con una
desviacin estndar del 1,03% y un promedio del error cuadrtico medio del 12,01% con una
desviacin estndar del 0,79%. Finalmente el quinto caso, corresponde a una red neuronal con
resolucin de imagen de entrada de 5x7 pxeles, con 35 neuronas de entrada y 40 neuronas
ocultas, que alcanz una tasa media de reconocimiento del 75,47% con una desviacin
estndar del 1,82% y un promedio del error cuadrtico medio del 23,94% con una desviacin
estndar del 1,14% (Ver Tabla 20).
TABLA 20
MEJORES ARQUITECTURAS DE LA RED NEURONAL
PARA CADA RESOLUCION PIRAMIDAL ANALIZADA. SE MUESTRAN LAS
TASAS MEDIAS DE RECONOCIMIENTO (TMR) Y EL PROMEDIO DE LOS ERRORES
CUADRATICOS MEDIOS (PECM), CON SUS RESPECTIVAS DESVIACIONES ESTANDARES
RESOLUCION
IMAGEN
[Pxeles]

NEURONAS
DE
ENTRADA

NEURONAS
OCULTAS

92x112
46x56
23x28
11x14
5x7

10.304
2.576
644
154
35

60
30
40
30
40

TMR
[%]

PRUEBA
PECM
TMR
[%]
[%]

94,53
94,92
95,63
91,80
75,47

1,19
1,03
0,58
1,03
1,82

9,49
9,23
9,74
12,01
23,94

PECM
[%]
0,78
0,50
0,63
0,79
1,14

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

92

5.5 DETERMINACION DE LA MEJOR ARQUITECTURA Y CONFIGURACION DE


LA RED NEURONAL PARA RECONOCIMIENTO DE ROSTROS CON LA
PRIMERA PARTICION
Anlogamente a la Seccin 5.4, para seleccionar el mejor caso de los cinco casos de reduccin
piramidal, se someten a Test Estadstico las medias y desviaciones estndares de las tasas de
reconocimiento para las diferentes arquitecturas de la Tabla 20. Esto permite seleccionar la
mejor arquitectura de red neuronal de retropropagacin que permite las mximas tasas medias
de reconocimiento de rostros y con mnimos promedios de errores cuadrticos medios. Los
resultados de este ltimo test, se pueden ver en la Tabla 21.
TABLA 21
DIFERENTES ARQUITECTURAS DE LA RED NEURONAL
CON RESPECTO A LA CANTIDAD DE NEURONAS DE ENTRADA Y DE NEURONAS
OCULTAS (NH) SOMETIDOS A TEST, PARA DIFERENTES RESOLUCIONES DE IMAGENES
RESOLUCION
IMAGEN

NH

RESOLUCION
IMAGEN

NH

TEST DE MEDIAS EN TR PARA LAS PRUEBAS


H0
SIGNIFICANCIA
C.I.
[%]
1
49,41
[-1,58 0,80]
0
3,51
[-2,09 -0,08]
0
2,27e-2
[1,54 3,92]
0
5,86e-11
[17,41 20,71]

92x112
92x112
92x112
92x112

60
60
60
60

46x56
23x28
11x14
5x7

30
40
30
40

46x56
46x56
46x56

30
30
30

23x28
11x14
5x7

40
30
40

1
0
0

11,36
2,79e-3
2,54e-11

[-1,59 0,19]
[2,02 4,22]
[17,86 21,03]

23x28
23x28

40
40

11x14
5x7

30
40

0
0

2,63e-5
4,52e-12

[2,93 4,72]
[18,70 21,60]

11x14

30

5x7

40

2,79e-10

[14,74 17,91]

Segn la investigacin desarrollada en este proyecto, la mejor red neuronal de


retropropagacin para el reconocimiento de rostros humanos en la primera particin de la base
de datos ORL, ser una red neuronal con los parmetros learning rate de 0,26 y momentum de
0,12. Dicha red utilizar imgenes de entrada de 23x28 pxeles y tendr una arquitectura de
644 neuronas de entrada, 40 neuronas ocultas y 40 neuronas de salida. Con esta configuracin
se logr una tasa media de reconocimiento del 95,63%, con una desviacin estndar del 0,58%
y un promedio de error cuadrtico medio de un 9,74%, con una desviacin estndar del 0,63%.
Cabe hacer notar que pese al grupo de entrenamiento reducido, seis imgenes de
entrenamiento por individuo, la capacidad de generalizacin de la red alcanz una taza de
reconocimiento media del 95,63% y que es superior a otros artculos publicados con
utilizacin de redes neuronales, con otros mtodos y la misma base de datos ORL (Lawrence
et al., 1997; Dai et al., 1997) (Ver Captulo I).
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

93

El pre-procesamiento previo utilizado, denominado estiramiento lineal de contraste,


normaliza los histogramas de la imgenes entrenadas y probadas, logrando que la red sea
indiferente a las variaciones de luminosidad del medioambiente que se desea automatizar.

5.6 RESULTADOS DE LOS EXPERIMENTOS CON LA SEGUNDA PARTICION


Dado el nmero de neuronas ocultas obtenidas con los resultados con la primera particin, que
ya se mostraron, se realizan las pruebas para la segunda particin. En la Tabla 22, se muestran
los resultados del aprendizaje de la red neuronal con la segunda particin, con ocho muestras
consecutivas con inicializaciones de pesos aleatoria. Se muestra la resolucin de las imgenes
de entrada, la mejor cantidad de neuronas ocultas (NH) y la poca en que se registro la mejor
tasa de reconocimiento con su respectivo error cuadrtico medio, seleccionado en el conjunto
de validacin. Adems, se muestran las tasas de reconocimiento y error cuadrtico medio
registrados en dicha poca para los conjuntos de entrenamiento y prueba.
La segunda particin de entrenamiento de la base de datos ORL, corresponde a 4 imgenes de
entrenamiento, 3 de validacin y 3 de prueba por individuo. En la Tabla 23 se muestran los
resultados del reconocimiento de rostros para las cinco mejores arquitecturas de la red
neuronal y para cada resolucin piramidal analizada. Se muestran las tasas medias de
reconocimiento y el promedio de los errores cuadrticos medios alcanzados, con sus
respectivas desviaciones estndares para la segunda particin. Se puede observar que existe
una disminucin en las tasas medias de reconocimiento y un aumento en los promedios de los
errores cuadrticos medios, con respecto a la Tabla 20 de la primera particin. Esto se debe a
la disminucin en el conjunto de entrenamiento, que en este caso fue equivalente a un 66,66%
(4/6), causa que la red decaiga considerablemente en su desempeo (Freeman et al., 1993;
Hilera et al., 1995). Por tanto se puede ver que una disminucin en la cantidad de patrones de
entrenamiento causa una disminucin considerable en el desempeo de las redes neuronales y
ms patrones de ejemplos, permite mejores tasas de reconocimiento.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

94

TABLA 22
ENTRENAMIENTOS DE LA RED NEURONAL CON LA SEGUNDA
PARTICION SOLO PARA LAS MEJORES ARQUITECTURAS.
SE MUESTRA LA MEJOR TASA DE RECONOCIMIENTO (TR) CON
SU RESPECTIVO ERROR CUADRATICO MEDIO (ECM), SELECCIONADO
EN EL CONJUNTO DE VALIDACION. IDEM PARA ENTRENAMIENTO Y PRUEBA
RESOLUCION
IMAGEN
[PIXELES]
92x112
92x112
92x112
92x112
92x112
92x112
92x112
92x112

NH

EPOCAS

ENTRENAMIENTO
TR
ECM
[%]
[%]
100
0,36
100
0,22
100
0,28
100
0,23
100
1,56
100
0,32
100
0,66
100
0,19

VALIDACION
TR
ECM
[%]
[%]
90,83
13,59
89,17
13,95
90,83
13,04
90,00
13,51
93,33
18,30
89,17
15,09
92,50
14,89
91,67
13,13

PRUEBA
TR
ECM
[%]
[%]
85,00
15,66
86,67
15,72
81,67
17,16
79,17
17,32
80,00
21,37
82,50
17,89
83,33
18,02
84,17
16,15

60
60
60
60
60
60
60
60

159
189
169
200
96
164
118
218

46x56
46x56
46x56
46x56
46x56
46x56
46x56
46x56

30
30
30
30
30
30
30
30

208
248
183
213
286
256
200
238

100
100
100
100
100
100
100
100

1,23
0,53
1,41
1,40
0,37
0,50
1,30
0,62

91,67
93,33
90,83
90,00
90,00
90,83
91,67
90,83

15,85
13,04
16,71
15,40
13,25
12,90
15,62
12,90

82,50
85,00
81,67
79,17
83,33
85,00
79,17
86,67

18,35
17,39
19,12
19,70
16,34
14,67
20,01
15,79

23x28
23x28
23x28
23x28
23x28
23x28
23x28
23x28

40
40
40
40
40
40
40
40

231
242
298
272
236
233
275
288

100
100
100
100
100
100
100
100

1,99
1,71
1,01
1,27
1,64
1,79
1,33
0,86

90,00
90,00
91,67
90,83
91,67
91,67
91,67
90,83

15,63
14,64
14,28
14,25
14,93
14,86
13,99
13,96

85,00
85,00
86,67
85,83
85,00
84,17
89,17
86,67

18,86
16,79
16,38
16,96
17,34
17,75
16,84
16,42

11x14
11x14
11x14
11x14
11x14
11x14
11x14
11x14

30
30
30
30
30
30
30
30

421
433
456
479
453
489
476
477

99,38
99,38
100
100
99,38
99,38
98,75
100

4,85
4,40
3,75
2,68
4,04
2,44
2,86
3,19

85,00
86,67
85,00
86,67
86,67
85,83
85,00
85,83

19,43
18,66
17,14
16,98
18,11
16,36
18,35
18,32

81,67
78,33
79,17
84,17
75,00
80,00
76,67
80,83

23,59
22,72
20,64
19,75
22,55
19,55
21,31
20,36

5x7
5x7
5x7
5x7
5x7
5x7
5x7
5x7

40
40
40
40
40
40
40
40

1280
1454
1099
1017
1027
1385
1164
1251

98,75
98,13
98,75
96,88
97,50
99,38
98,13
98,13

2,62
1,99
4,07
5,56
5,81
1,51
3,16
3,09

70,00
75,83
74,17
71,67
71,67
74,17
75,00
74,17

26,94
25,31
25,82
26,21
26,30
25,83
25,24
25,93

60,00
65,00
65,83
62,50
65,83
65,00
62,50
60,83

29,95
29,44
28,35
29,74
28,80
29,01
29,24
29,88

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

95

TABLA 23
MEDIAS DE RECONOCIMIENTO CON LA SEGUNDA PARTICION.
SE MUESTRAN LAS TASAS MEDIAS DE RECONOCIMIENTO (TMR)
Y EL PROMEDIO DE LOS ERRORES CUADRATICOS MEDIOS (PECM),
CON SUS RESPECTIVAS DESVIACIONES ESTANDARES (VER TABLA 22)
RESOLUCION NH
IMAGEN
[PIXELES]
92x112
46x56
23x28
11x14
5x7

60
30
40
30
40

TMR
[%]

90,94
91,15
91,04
85,83
73,34

VALIDACION
TMR PECM PECM
[%]
[%]
[%]
1,51
14,44
1,73
1,09
14,46
1,58
0,74
14,57
0,57
0,77
17,92
1,01
1,99
25,95
0,55

TMR
[%]

PRUEBA
TMR PECM
[%]
[%]

82,81
82,81
85,94
79,48
63,44

2,74
2,74
1,57
2,89
2,29

17,41
17,67
17,17
21,31
29,30

PECM
[%]
1,85
1,95
0,82
1,49
0,56

En los Grficos 13, 15, 17, 19 y 21, se muestran las tasas de reconocimiento de la red neuronal
en funcin del nmero de pocas de entrenamiento, correspondiente los conjuntos de
entrenamiento, validacin y prueba. En los Grficos 14, 16, 18, 20 y 22, muestran los errores
cuadrticos medios de la red neuronal en funcin del nmero de pocas de entrenamiento,
correspondiente a los conjuntos de entrenamiento, validacin y prueba. Dichas curvas, son
todas obtenidas de los entrenamientos correspondiente a las ltimas muestras de cada uno de
los cinco casos de reduccin de la Tabla 22. Todos los casos corresponden a entrenamientos
con la segunda particin.
Se puede observar, que en la medida que la imgenes son reducidas en forma sistemtica, la
red neuronal requiere de un nmero mayor de pocas de entrenamiento, para poder lograr
alcanzar tasas de reconocimiento equivalentes a las imgenes ms grandes. Aun as, se puede
ver que para la ltima reduccin, la red tiene un decaimiento muy grande en su rendimiento.
Cabe hacer notar que todas los grficos que se mostrarn a continuacin (Grficos 13 al 22)
son las estadsticas almacenadas automticamente por el software desarrollado en este
Proyecto. Estas estadsticas son almacenadas en una base de datos para su posterior
recuperacin. Para mayores detalles ver Anexos.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

96

GRAFICO 13
TASAS DE RECONOCIMIENTO, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 92x112 PIXELES

GRAFICO 14
ERRORES CUADRATICOS MEDIOS, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 92x112 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

97

GRAFICO 15
TASAS DE RECONOCIMIENTO, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 46x56 PIXELES

GRAFICO 16
ERRORES CUADRATICOS MEDIOS, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 46x56 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

98

GRAFICO 17
TASAS DE RECONOCIMIENTO, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 23x28 PIXELES

GRAFICO 18
ERRORES CUADRATICOS MEDIOS, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 23x28 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

99

GRAFICO 19
TASAS DE RECONOCIMIENTO, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 11x14 PIXELES

GRAFICO 20
ERRORES CUADRATICOS MEDIOS, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 11x14 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.100
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

GRAFICO 21
TASAS DE RECONOCIMIENTO, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 5x7 PIXELES

GRAFICO 22
ERRORES CUADRATICOS MEDIOS, EN PORCENTAJE, EN FUNCION DEL NUMERO
DE EPOCAS, PARA LA SEGUNDA PARTICION, CON IMAGENES DE 5x7 PIXELES

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.101
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

CAPITULO VII - CONCLUSIONES


En este Proyecto de Ttulo satisfactoriamente se desarroll, a nivel de prototipo experimental,
implementado en software, un sistema de reconocimiento de rostros humanos basado en una
red neuronal de retropropagacin. Se estudi la resolucin espacial de las imgenes utilizadas
y el nmero de neuronas ocultas de la red neuronal, encontrando la mejor arquitectura y
configuracin. Se encontraron los parmetros del aprendizaje de la red que permitiera
maximizar la tasa de reconocimiento de rostros humanos, logrando entrenar y medir su
capacidad de generalizacin. Capacidad demostrada que es eficaz y eficiente.
Para desarrollar y probar el modelo de clasificacin, se utiliz la base de datos internacional
Olivetti Research Laboratory (ORL) [http://www.cam-orl.co.uk/facedatabase.html]. Esta base
de datos contiene 10 rostros frontales de 40 individuos, i.e., 400 rostros. Se utilizaron dos
particiones distintas de la base de datos. La primera particin correspondi a dividir la base de
datos en dos conjuntos: entrenamiento que contiene seis imgenes por individuo (total 240), y
otro conjunto de prueba con cuatro imgenes por individuo (total 160). La segunda particin
correspondi a dividir la base de datos en tres conjuntos: cuatro imgenes por individuo para
entrenamiento (total 160), tres imgenes por individuo para validacin y prueba (total 120
cada uno). Se utiliz estiramiento lineal de contraste logrando modificar los histogramas de las
imgenes, permitiendo normalizar la luminosidad presente en llas.
Los resultados de este proyecto para la primera particin de la base de datos muestran que la
mejor arquitectura y configuracin de una red neuronal de retropropagacin para
reconocimiento de rostros humanos ser aquella red que posea imgenes de entrada de 23x28
pxeles, 644 neuronas de entrada, 40 neuronas ocultas y 40 neuronas de salida, con los
parmetros learning rate de 0,26 y momentum de 0,12. Esta red neuronal maximiza las tasas
de reconocimiento y minimiza las tasas de error. Las tasas media de reconocimiento
alcanzadas por la red neuronal, para ocho muestras aleatorias, fueron de un 95,63% y su
correspondiente desviacin estndar de 0,58%. El error de clasificacin obtenido por la red fue
de un 4,37%. Se determin que el promedio del error cuadrtico medio alcanzado por este
modelo fue de un 9,74% y su respectiva desviacin estndar de un 0,63% medidos en el
conjunto de prueba.
Utilizando la primera particin, se concluye que la mejor arquitectura para la red neuronal de
retropropagacin con las imgenes originales de la base de datos ORL, sin reduccin espacial,
imgenes de 92x112 pxeles, es aquella red que posee 10.304 neuronas de entrada, 60
neuronas ocultas y 40 neuronas de salida. Las tasas media de reconocimiento alcanzadas por la
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.102
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

red neuronal, para ocho muestras aleatorias, fueron de un 94,53% y su correspondiente


desviacin estndar de un 1,19%. El error de clasificacin obtenido por la red fue de un
5,47%. Se determin que el promedio del error cuadrtico medio alcanzado por el modelo fue
de un 9,49% y su respectiva desviacin estndar de un 0,78% medidos en el conjunto de
prueba.
Se determin que para la primera particin, la reduccin de escala mediante reduccin
piramidal utilizada permite una disminucin significativa del nmero de pesos. La red
original, con imgenes de 92x112 pxeles, requiere de 10.404 neuronas en total, y por tanto de
mayor nmero de conexiones neuronales, correspondiente a 620.740 pesos, incluyendo bias.
Este gran nmero de pesos debe ser ajustado por el algoritmo de aprendizaje, lo que requiere
de largos tiempos de proceso y de recursos computaciones como memoria y CPU. Con el
modelo propuesto, con imgenes de 23x28 pxeles obtenidas mediante reduccin piramidal, el
nmero de neuronas requerido para realizar los mismos objetivos que la red neuronal original,
es considerablemente menor. Se requieren de 724 neuronas en total y, por tanto, el nmero de
conexiones neuronales disminuye considerablemente a 27.440 pesos, incluyendo bias. Esto
significa una disminucin significativa en los tiempos de proceso y en el consumo de recursos
computacionales.
Con el modelo propuesto y utilizando la primera particin se requiere de un 6,96% de la
cantidad total de neuronas requeridas por el modelo original y de un 4,41% de la cantidad total
de pesos requeridos por el modelo original. Con estos resultados, puede verse la ventaja de la
reduccin propuesta. Por otra parte, esta reduccin no genera prdidas en la capacidad de
clasificacin. Por el contrario, con el modelo propuesto se obtuvo mejores tasas medias de
reconocimiento y con menor varianza.
El mtodo utilizado, en ambas particiones, de estiramiento lineal de contraste logra que las
imgenes queden normalizada para ser clasificadas con la red neuronal, lo que permite que
esta red sea tolerante a los cambios de luminosidad del medioambiente.
Esta investigacin, puede ser comparada con los resultados obtenidos en otros trabajos previos
publicados en revistas cientficas que utilizaron la misma base de datos ORL. Se tiene por
ejemplo los mtodos propuestos en (Lawrence et al., 1997 y Dai et al., 1997) (Ver Seccin
1.3). En la primera investigacin (Lawrence et al., 1997), obtuvo un error de un 10,5%, con el
modelo Perceptron Multicapa propuestos, y un 3,8% de error, con el modelo hbrido
propuesto, en que se utiliza la mezcla de dos redes neuronales, una red SOM y una red de
convolucin, lo que produce, obviamente, notables mejoras en sus tasas de error. La segunda
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.103
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

investigacin (Dai et al., 1997), obtuvo una tasa de reconocimiento de un 92% y una tasa de
rechazo de un 5%. Ese modelo utiliza una red neuronal de Hopfield combinado con un juego
de patrones. Por consiguiente, los resultados obtenidos en este Proyecto de Ttulo son
comparables y superan algunos de los resultados obtenidos en las investigaciones
mencionadas. Se obtienen mejores resultados que en (Dai et al., 1997) y que en el modelo
Perceptron Multicapa en (Lawrence et al., 1997). Obviamente, no supera los resultados con el
modelo hbrido propuesto por (Lawrence et. al., 1997).
Con estos resultados de la primera particin, se puede ver que la red neuronal de
retropropagacin desarrollada e implementada computacionalmente en software, tiene un muy
buen desempeo. Su capacidad de generalizacin es muy buena, pese a que la cantidad de
imgenes entrenadas fuese reducida, 6 imgenes de entrenamiento por individuo, debido a la
poca disponibilidad de imgenes por persona que posee la base de datos ORL. De todas
formas esta base de datos internacional se prefiri utilizar por los motivos ya mencionados,
para poder realizar comparaciones con respecto a otros trabajos publicados y dedicados a este
tema.
Con la segunda particin se utiliz la mejor arquitectura y configuracin de la red neuronal
encontrado para la primera particin, i.e., imgenes de 23x28 pxeles, 644 neuronas de
entrada, 40 neuronas ocultas y 40 neuronas de salida, con parmetros learning rate de 0,26 y
momentum de 0,12. Las tasas medias de reconocimiento alcanzadas por la red neuronal, para
ocho muestras aleatorias, fueron en el conjunto de validacin de un 91,04% y su
correspondiente desviacin estndar fue de un 0,74%. El promedio del error cuadrtico medio
alcanz un 14,57% y su respectiva desviacin estndar un 0,57%. Para el conjunto de prueba
los valores de las tasas medias de reconocimiento fueron de 85,94% y su correspondiente
desviacin estndar de 1,57%. El promedio del error cuadrtico medio alcanzado de un
17,17% y su respectiva desviacin estndar de 0,82%.
Utilizando la segunda particin, se realizaron simulaciones con la red neuronal de
retropropagacin con imgenes originales de la base de datos ORL, de 92x112 pxeles, con
10.304 neuronas de entrada, 60 neuronas ocultas y 40 neuronas de salida. Las tasas media de
reconocimiento alcanzadas por la red neuronal, para ocho muestras aleatorias, fueron en el
conjunto de validacin de un 90,94% y su correspondiente desviacin estndar fue de 1,51%.
El promedio del error cuadrtico medio alcanzado fue de 14,44% y su respectiva desviacin
estndar de 1,73%. Para el conjunto de prueba los valores de las tasas medias de
reconocimiento fueron de un 82,81% y su correspondiente desviacin estndar de 2,74%, con

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.104
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

un promedio del error cuadrtico medio alcanzado de un 17,41% y su respectiva desviacin


estndar de un 1,85%.
Se puede observar, que con la segunda particin, existe una disminucin en las tasas medias
de reconocimiento y un aumento en los promedios de los errores cuadrticos medios, con
respecto a los valores obtenidos con la primera particin. Esto se debe a la disminucin en el
conjunto de entrenamiento, equivalente a un 66,66 %, lo que causa que la red decaiga
considerablemente en su desempeo. Se puede concluir, que una disminucin en la cantidad
de patrones de entrenamiento causa una disminucin considerable en el desempeo de las
redes neuronales y, por tanto, ms patrones de ejemplos permite mejores tasas de
reconocimiento.
Satisfactoriamente se implement el modelo neuronal de retropropagacin para
reconocimiento de rostros humanos, permitiendo obtener mximas tasas de reconocimiento y
mnimas tasas de error, en forma eficaz y eficiente.
Empricamente se determin los parmetros para el conjunto de entrenamiento que permitiera
una convergencia rpida del algoritmo, evitando mnimos locales.
Se encontr la resolucin adecuada para las imgenes de rostros humanos, que permitiera una
clasificacin optimizada, utilizando una base de datos de rostros humanos que permiti
entrenar la capacidad de generalizacin de la red neuronal.
Finalmente, se evalu el comportamiento del modelo respecto de sus tasas de reconocimiento
y de error en la base de datos de generalizacin, conjunto de prueba.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.105
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

BIBLIOGRAFIA
Aho, Alfred V., Hopcroft, John E. y Ullman, Jeffrey D. (1998) Estructura de Datos y
Algoritmos. Addison-Wesley Iberoamericana. S.A. Madrid. Espaa.
Ajenjo, Alberto D. (1993) Tratamiento Digital de Imgenes. Ediciones Anaya Multimedia.
S.A. Madrid. Espaa.
Arriagada, Gustavo A. (1960) Introduccin al Mtodo Experimental. Teora de los Errores.
Editorial Universitaria. S.A. Santiago. Chile.
Brunelli, R. y Mich, O. (1996) Spotlt! An Interactive Identikit System. Graphical Models
and Image Processing. Vol. 58. No 5. pp. 399-404. Pretoria. South Africa.
Cceres, Francisco (2002) Bases Biolgicas y Tericas de las Redes Neuronales
Artificiales. Proyecto de Licenciatura de Ingeniera Civil Electrnica. Facultad de Ingeniera.
Universidad Mayor. Santiago. Chile.
Chellappa, Rama, Wilson, Charles L. y Sirohey, Saad (1995) Human and Machine
Recognition of Faces: A Survey. Proceedings of the IEEE. Vol. 83. No. 5. pp. 705-740.
Costen, Nicholas P., Parker, Denis M. y Craw, Ian (1996) Effects of High-Pass and LowPass Spatial Filtering on Face Identification. Perception & Psychophysics 58. No 4. pp. 602612. Aberdeen. Scotland.
Cramer, Harald (1960) Mathematical Methods of Statistics. Almqvist & Wiksells. Upsala.
Sweden.
Dai, Ying y Nakano, Yasuaki (1997) Recognition Of Facial Images With Low Resolution
Using a Hopfield Memory Model. Shinshu University. Pattern Recognition Society.
Published by Elsevier Science Ltd. Nagano. Japan.
Engel, Alejandro B. (1978) Elementos de Biomatemtica. Secretara General de la
Organizacin de los Estados Americanos. Programa Regional de Desarrollo Cientfico y
Tecnolgico. Washinton. D.C. Campinas. Brasil.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.106
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Freeman, James A. y Shapura, David M. (1993) Neural Network. Algorithms, Applications,


and Programming Techniques. Addison-Wesley Publishing Company. Inc. Massachusetts.
E.U.A.
Gmez, Daro M. (1993) Reconocimiento de Formas y Visin Artificial. RA-MA 1994.
Addison-Wesley Iberoamericana. S.A. Wilminton. Delaware. E.U.A.
Gonzlez, Rafael C. y Woods, Richard E. (1996) Tratamiento Digital de Imgenes. AddisonWesley Iberoamericana. S.A.
Haykin Simon (1996) Neural Networks Expand SPs Horizons. Advanced Algorithms for
Signal Processing Simultaneously Account for Nonlinearity, Nonstationarity and NonGaussianity. IEEE Signal Processing Magazine.
Hilera, Jos y Martnez, Vctor (1995) Redes Neuronales Artificiales. Fundamentos, Modelos
y Aplicaciones. Addison-Wesley Iberoamericana S.A. Wilminton. Delaware. E.U.A.
Hu, Jianming, Yan, Hong y Sakalli, Mustafa (1999) Locating Head and Face Boundaries for
Head-Shoulder Images. Pattern Recognition 32. pp. 1317-1333. Sydney. Australia.
Inprise Corporation (2000) Developers Guide Borland DELPHI 5 for Windows95,
Windows 98 & Windows NT.
Jain, Anil K., Mao, Jianchang y Mohiuddin K.M. (1996) Artificial Neural Networks: A
Tutorial. IEEE.
Jain, Anil K. (1989) Fundamentals of Digital Image Processing. Prentice-Hall, Inc.
Joyanes, Luis (1993) Turbo Pascal 7.0 a su Alcance. McGraw-Hill. Interamericana de
Espaa. S.A.
Kosko, Bart (1992) Neural Network for Signal Processing. Prentice-Hall. Inc. A Simon &
Shuster Company. New Jersey. U.S.A.
Kosko, Bart (1997) Fuzzy Engineering. Prentice-Hall. Inc. A Simon & Shuster Company.
New Jersey. U.S.A.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.107
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Lass, Harry (1969) Vector and Tensor Analysis. McGraw-Hill Book Company. INC.
Lawrence, Steve, Lee, C., Tsoi, Ah Chung y Back, Andrews D. (1997) Face Recognition: A
Convolutional Neural-Network Approach. IEEE Transactions on Neural Networks. Vol. 8.
No. 1. pp. 98-113.
Lee, Lily (2001) Gait Dynamics for Recognition and Classification. MIT. Artificial
Intelligence Laboratory.
Lee, S.Y., Ham, Y. K. y Park, R. H. (1996) Recognition of Human Front Faces Using
Knowledge-Based Feature Extraction and Neuro-Fuzzy Algorithm. Pattern Recognition. Vol.
29. No. 11. pp. 1863-1876. Seoul. Korea.
Lichnerowicz, A. (1962) Elementos de Calculo Tensorial. Librairie Armand Coli. Paris.
Francia.
Lippman, Richard (1987) An Introduction to Computing with Neural Nets. IEEE ASSP
Magazine. Vol. 3. No. 4. pp. 4-22.
Liu, Chengjun y Wechsler, Harry (2000) Evolutionary Pursuit and Its Application to Face
Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 22. No
6. pp. 670-682.
Lyons, Michael, Plante Andre, Jehan, Sebastien, Inoue, Seiki y Akamatsu, Shigeru (1998)
Avatar Creation using Automatic Face Recognition. Proceedings, ACM Multimedia 98. pp.
427-434.
Marteens, Ian (1998) La Cara Oculta de DELPHI 4. Programacin Avanzada para Bases de
Datos. Danysoft Internacional. S.L. Alcobendas. Madrid.
MathWorks (2000) User`s Guide Version 2.0. Fuzzy Logic Toolbox for Use with
MATLAB. MathWorks, Inc.
MathWorks (2000) User`s Guide Version 2.1. Image Processing Toolbox for Use with
MATLAB. MathWorks, Inc.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.108
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

MathWorks (2000) User`s Guide Version 3.0. Neural Network Toolbox for Use with
MATLAB. MathWorks, Inc.
MathWorks (2000) User`s Guide Version 3.0. Statistics Toolbox for Use with MATLAB.
MathWorks, Inc.
Mothes, J. (1961) Statistique Appliquee. Escole Nationale Suprieure de la Mtallurgie et de
lIndustrie des Mines, de Nancy. Paris. Francia.
Nakajima, Chikahito, Pontil, Massimiliano, Heisele, Bernd y Poggio, Tomaso (2000) People
Recognition in Image Sequences by Supervised Learning. Center for Biological and
Computational Learning Department of Brain and Cognitive Sciences. MIT. Artificial
Intelligence Laboratory.
Nsnen, Risto (1999) Spatial Frequency Bandwidth Used in the Recognition of Facial
Images. Vision Research 39. pp. 3824-3833. Helsinki. Finland.
Parker, D. (1982) Learning Logic. Invention Report. S81-64. File 1. Office of Technology
Licensing. Stanford University.
Purnell, D. W., Nieuwoudt, C. y Botha, E. C. (1998) Automatic Face Recognition in a
Heterogeneous Population. Pattern Recognition Letters 19. pp. 1067-1075.
Rosenblatt, F. (1958) The Perceptron: A probabilistic model for information storage and
organization in the brain. Psychological Review, 65. pp. 386-408. Reimpreso (1988)
Neurocomputing. pp. 92-114, MIT Press.
Rumelhart, D., Hinton, G. y Williams, R. (1986) Learning Representations by Backpropagating Errors. Nature 323. pp. 533-536.
Rumelhart, D. y McClelland, J. (1986) Paralell Distributed Processing: Explorations in the
Microstructure of Cognition. Vol. 1. Foundations. MIT Press. pp. 318-362.
Schalkoff R.J. (1989) "Pyramidal Analysis". Digital Image Processing and Computer Vision.
Wiley. pp. 341-344.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.109
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Werbos, P. (1974) Beyond Regression: New Tools for Prediction and Analisys in the
Behavioral Sciences. Ph. D. Thessis. Harvard University.
Widrow, B. (1960) Adaptive Switching Circuits. IREWESCON Convention Record. Part 4.
pp. 96-104. Reimpreso (1988) Neurocomputing. pp. 126-134, MIT Press.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.110
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

ANEXOS

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.111
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

ANEXO 1
INTERFAZ DE USUARIO DEL SOFTWARE
SISTEMA DE CAPTURA DE VIDEOS E IMAGENES
En este Anexo se presenta el software de captura de videos e imgenes desarrollado para este
proyecto. En la Figura A1.1, se puede ver la interfaz de usuario mostrando la captura de la
imagen de un rostro. Se puede observar, que el programa automticamente convierte las
imgenes de color a blanco y negro, codificadas en 8 bit, debido a que la red neuronal procesa
las imgenes en forma vectorial codificando cada pxel (componente del vector) en 256
niveles de grises, pertenecientes al intervalo [0,255].
FIGURA A1.1
INTERFAZ DE USUARIO PARA EL SOFTWARE DE CAPTURA DE VIDEOS E IMAGENES

Este software, adems, le permite al usuario poder escoger si desea, o no, realizar algn tipo
de modificacin sobre la imagen capturada dentro del rectngulo que determina el rostro
humano. Dentro de dicha rea, el software otorga la posibilidad de hacer hasta cuatro
reducciones piramidales, ver Figura A1.2, donde se muestran las alternativas de reduccin.
Observar que en la Figura A1.2, muestra escogida la opcin de dos reducciones piramidales
consecutivas, lo que causa que la imagen original de 92x112 pxeles sea reducida a una de
23x28 pxeles.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.112
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A1.2
MUESTRA LAS OPCIONES DE REDUCCION PIRAMIDAL
Y EL RESULTADO DE APLICARLA. SE PUEDE VER QUE LA IMAGEN
ORIGINAL DE 92x112 PIXELES FUE REDUCIDA A UNA IMAGEN DE 23x28 PIXELES

Este software, tambin permite al usuario escoger si desea, o no, modificar el histograma de la
imagen del rostro de una persona capturada, aplicando, o no, estiramiento lineal de contraste.
El resultado de ello, puede verse en la Figura A1.3, donde se nota claramente la diferencia de
contraste entre la imagen del rostro original (derecha) y la imagen del rostro modificada
(izquierda).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.113
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A1.3
MUESTRA LA OPCION PARA MODIFICAR EL HISTOGRAMA DE LA
IMAGEN DEL ROSTROS HUMANO Y EL RESULTADO DE APLICARLA. SE PUEDE
VER LA DIFERENCIA DE CONTRASTE ENTRE LA IMAGEN ORIGINAL Y LA MODIFICADA

El programa permite, adems, poder ver los grficos de los histogramas tanto de la imagen
original, como de la modificada, lo que permite una fcil comparacin del efecto que causa el
estiramiento lineal de contraste sobre los histogramas.
Los histogramas de ambas imgenes pueden verse al pulsar el botn HISTOGRAMAS (Ver
Figura A1.4) y pueden ser imprimados o guardados como imgenes en formato bmp, segn
lo que ms se prefiera.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.114
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A1.4
MUESTRA LOS HISTOGRAMAS DE LA IMAGEN ORIGINAL
Y EL DE LA IMAGEN CON ESTIRAMIENTO LINEAL DE CONTRASTE

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.115
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

ANEXO 2
INTERFAZ DE USUARIO DEL SOFTWARE
RED NEURONAL BACKPROPAGATION PARA
RECONOCIMIENTO DE ROSTROS HUMANOS
En este Anexo se presenta el software de la red neuronal de retropropagacin para
reconocimiento de rostros humanos desarrollado para este proyecto. En la Figura A2.1, se
puede ver la interfaz de usuario de bienvenida.
FIGURA A2.1
INTERFAZ DE BIENVENIDA
DE USUARIO PARA EL SOFTWARE DE RED NEURONAL
BACKPROPAGATION PARA RECONOCIMIENTO DE ROSTROS HUMANOS

Para ingresar al sistema se debe apretar el botn Ingresar, pero previamente se debe tener
un nombre de usuario y una clave de acceso (Ver Figura A2.2) dada por el administrador de la
red neuronal.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.116
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A2.2
INTERFAZ DE ACCESO DE USUARIO PARA INGRESAR
AL SOFTWARE DE LA RED NEURONAL BACKPROPAGATION

Una vez superada la interfaz de seguridad, se puede comenzar hacer uso del software de la red
neuronal Backpropagation. La interfaz de usuario para este software es mostrada en la
Figura A2.3, donde se pueden ver las diferentes opciones.
Este software permite ingresar los parmetros del aprendizaje, tales como: learning rate,
momentum, cantidad de pocas de entrenamiento y nmero de aprendizajes consecutivos que
se desean realizar. Por otra parte, permite ingresar al usuario la forma en que es particionada la
base de datos de entrenamiento, indicando cuantas imgenes por persona se utilizarn para
entrenamiento, validacin y prueba.

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.117
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A2.3
MUESTRA LA INTERFAZ DE USUARIO DE LA RED
NEURONAL PARA RECONOCIMIENTO DE ROSTROS HUMANOS

Apretando el botn ULTIMA CONFIGURACION el programa carga automticamente en


pantalla los ltimos valores de los parmetros con que fue entrenado (Ver Figura A2.4).
FIGURA A2.4
MUESTRA LOS DETALLES QUE REGISTRA LA RED
NEURONAL DESPUES DE HABER TERMINADO UN ENTRENAMIENTO

Una vez que el programa termina su etapa de aprendizaje, indicar en pantalla la fecha y hora
de inicio, como tambin, la fecha y hora de trmino, entregando el nmero de horas, minutos y
segundos que tom el entrenamiento (Ver Figura A2.4).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.118
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Presionando el botn DETALLES BASE DE DATOS (Ver Figura A2.4), se puede tener un
rpido acceso a la informacin almacenada en la base de datos que contiene este programa,
donde se especifican caractersticas tales como: nmero de patrn de entrenamiento que
representa el individuo, su imagen, R.U.T. y nombre completo. Cabe hacer notar que estos dos
ltimas caractersticas son ficticias y slo sirven como modelo de ejemplo (Ver Figura A2.5).
FIGURA A2.5
MUESTRA LOS DETALLES QUE SE
ALMACENAN EN LA BASE DE DATOS DE LA RED NEURONAL

Por otra parte, presionando el botn ESTADISTICAS (Ver Figura A2.4), el programa
muestra el formulario con toda la informacin almacenada una vez terminado su
entrenamiento (Ver Figura A2.6).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.119
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A2.6
MUESTRA LAS ESTADISTICAS QUE EL PROGRAMA
(RED NEURONAL) ALMACENA DURANTE SU ETAPA DE APRENDIZAJE

Se puede ver que el programa almacena esta informacin en otra base de datos, donde guarda
valores de inters tales como: resolucin de las imgenes entrenada, tiempo total del
aprendizaje, parmetros definidos para el aprendizaje (learning rate, momentum, nmero de
pocas de entrenamiento, de iteraciones y el nmero de aprendizajes solicitados). Adems,
guarda informacin de como fue particionada la base de datos (nmero de patrones para
entrenamiento, validacin y prueba). Tambin, almacena informacin adicional como la
cantidad total de imgenes usadas para el entrenamiento, la validacin y la prueba. Y guarda la
arquitectura de la red neuronal utilizada en el entrenamiento, caracterizada por: cantidad de
neuronas de entrada, ocultas y de salida. Con esto ltimo, puede notarse que el programa
permite que en tiempo de ejecucin sea modificada la arquitectura de la red neuronal.
Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.120
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

Automticamente, una vez terminado un aprendizaje, el programa es capaz de obtener la


poca en que se registro el mejor caso de entrenamiento medido en el conjunto de validacin,
registrando as, para dicha poca, las tasas de reconocimiento y de error cuadrtico medio
obtenidas en los conjuntos de entrenamiento y prueba. Esto puede verse presionando el botn
MEJOR CASO APRENDIZAJE SEGUN CRITERIO DE VALIDACION (Ver Figura
A2.6). Anlogamente, puede almacenar la poca donde se registraron las mejores tasas de
reconocimiento y de error cuadrtico medio mediadas en forma independiente en los conjuntos
de entrenamiento, validacin y prueba, lo que adems, puede verse presionando el botn
MEJORES CASOS EN EL APRENDIZAJE INDEPENDIENTEMENTE (Ver Figura
A2.6).
El software almacena para el conjunto de entrenamiento, validacin y prueba las tasas de
aciertos, o reconocimientos (TR), como tambin, los errores cuadrticos medios (ECM) en
cada poca del aprendizaje. Esto le permite, fcilmente, generar los grficos: TR v/s pocas y
ECM v/s pocas, los que pueden verse presionando los botones: TR V/S EPOCAS (Ver
Figuras A2.7) y ECM V/S EPOCAS (Ver Figura A2.8).

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.121
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A2.7
MUESTRA EL GRAFICO: TASA DE RECONOCIMIENTO VERSUS EPOCAS, CALCULADO
AUTOMATICAMENTE DESPUES QUE LA RED NEURONAL TERMINA EL APRENDIZAJE

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.122
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

FIGURA A2.8
MUESTRA EL GRAFICO: ERROR CUADRATICO MEDIO VERSUS EPOCAS, CALCULADO
AUTOMATICAMENTE DESPUES QUE LA RED NEURONAL TERMINA EL APRENDIZAJE

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.123
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

ANEXO 3
MATRIZ DE ACIERTOS Y CONFUSIONES (ENTRENAMIENTOS 6 Y PRUEBA 4)
1
1
2

5
6
7
8
9
10
11
12
13
14
15
16
17

10

11

12

13

14

15

16

17

19

20

21

22

23

25

26

27

28

32

33

34

35

36

37

38

39

40

4
4
4
4
4
4
4
4
4
4
4
4
4
4
4

22

23

4
1

25

26

27

1
4

28

3
1

1
3

30

31

32

33

34

35

36

3
4

37

40

31

21

39

30

20

38

29

19

29

24

4
1

18

24

18

3
4

4
1

3
4
4

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin. Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de124
Ingeniera. Universidad Mayor. Santiago de Chile.

ANEXO 4
ALGUNOS EXPERIMENTOS DE ASOCIACION CON
IMAGENES NUNCA APRENDIDAS POR LA RED NEURONAL
IMAGEN DE ENTRADA IMAGEN DE SALIDA

Cceres Bascun, Francisco (2002) Reconocimiento de Rostros Humanos Basado en una Red Neuronal de Retropropagacin.125
Proyecto de Ttulo en Ingeniera Civil Electrnica. Facultad de Ingeniera. Universidad Mayor. Santiago de Chile.

También podría gustarte