Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Se presenta un sistema ptico de reconocimiento de patrones de imgenes usando redes neuronales para la identificacin
del lenguaje de seas empleado por personas sordomudas y con dificultad en el habla para su comunicacin. El sistema
parte de imgenes almacenadas que muestran la simbologa especfica usada en este tipo de lenguaje y con las cuales se
entrena una red neuronal multicapa con un algoritmo de retropropagacin. Inicialmente se preprocesan las imgenes con
objeto de adaptarlas y mejorar de cierta forma la capacidad de la red para discriminar los patrones, incluyendo dentro de
este proceso de filtrado algoritmos de reduccin y eliminacin de ruido as como de deteccin de bordes. El sistema es
evaluado usando las seas propias del lenguaje que no incluyen movimiento en su representacin y es comparado con otro
mtodo de reconocimiento que usa un correlador digital.
Abstract
This work presents an image pattern recognition system using neural network for the identification of sign language used
by deaf people to communicate. The system has several stored images that show the specific symbology in this kind of
language, which are employed to teach a multilayer neural network using a backpropagation algorithm. Initially, the
images are processed to adapt them and to improve the network ability for discrimination, including in this process
algorithms for filtering, reducing and eliminating noise as well as edge detection. The system is evaluated using the
signals of sign language that do not include movement in their representation and it is compared with other method of
recognition that uses a digital correlator.
* vargas.lorena@yahoo.com
L. Vargas, L. Barba: Sistema de Identificacin de Lenguaje de Seas usando Redes Neuronales Artificiales
o,
yk = (vk ) , (2)
223
Rev.Col.Fs., Vol.42, No.2 de 2010.
Un algoritmo basado en el gradiente toma un vector de ya sea conformado por otros individuos sordos o por cual-
pesos inicial, calcula la funcin de error y su gradiente, y quier persona que conozca la lengua de signos empleada.
luego obtiene un nuevo vector de pesos modificando el Mientras que con el lenguaje oral la comunicacin se esta-
vector de pesos inicial en direccin opuesta al gradiente de blece en un canal vocal-auditivo, el lenguaje de seas lo
la funcin de error, el cual por lo general es cuadrtico. Por hace por un canal gesto-viso-espacial.
consiguiente, la calidad del algoritmo de optimizacin
a)
empleado por la red fue el gradiente descendente; as el
error est disponible en la red retropropagacin. Este se
repite hasta que el error se encuentra en los lmites estable-
cidos [9].
Por tanto, por definicin los pesos se actualizan a travs
de la expresin:
w m+1 =w m + .( m ) , (3)
(e m ) 2 = ( d m w m . x m ) 2 . (4)
m = 2 .e m ' ( v m ). x m . (5)
La lengua de seas, o lengua de signos, es una lengua El conjunto de smbolos que conforman el lenguaje in-
natural de expresin y configuracin gesto-espacial y per- cluye seas estticas y seas con movimiento, as como
cepcin visual, gracias a la cual las personas sordas pueden seas para el abecedario. En este trabajo se emplean las
establecer un canal de comunicacin con su entorno social, imgenes que representan las seas del abecedario, y espe-
224
L. Vargas, L. Barba: Sistema de Identificacin de Lenguaje de Seas usando Redes Neuronales Artificiales
cficamente aquellas que no tienen movimiento para su Los resultados se analizan tomando como referencia
representacin, como una primera etapa del proyecto. En varias configuraciones de la red neuronal, es decir se modi-
total son 23 imgenes; la fig. 3 muestra el conjunto de fica el nmero de neuronas de cada capa y el nmero de
imgenes usadas para el entrenamiento de la red neuronal. capas internas. Eventualmente se analiza el aprendizaje de
la red con diferente cantidad de patrones de entrenamiento.
4. Resultados En el entrenamiento se asignaron valores deseados para
las imgenes de entrada, con separaciones entre ellas de
Para evaluar el desempeo de los algoritmos imple- 0.2 en el rango de -2.2 para la imagen que representa el
mentados se utilizaron imgenes fijas de 120 x 150 pixeles smbolo A hasta 2.4 para la imagen que representa el
en escala de grises con cada pixel codificado entre 0 (color smbolo Y.
negro) y 255 (color blanco). La programacin y las simu-
La fig. 5 muestra el resultado utilizando la red con la
laciones realizadas se trabajaron con MATLAB para eva-
configuracin mostrada en la fig. 2. La red se entren con
luar el comportamiento de la red. Como se mencion
las imgenes de los smbolos del abecedario mostradas en
anteriormente los pesos son cargados y almacenados pre- la fig. 3a), que en total fueron 23.
viamente.
El proceso inicial, una vez se ha almacenado en memo-
ria la imagen de entrada, est dado por una etapa de binari-
zacin y de deteccin de bordes. La fig. 4 ilustra el resulta-
do de aplicar estos algoritmos. Para la extraccin de bordes
se probaron varios algoritmos y el que mejor resultados
mostr fue el algoritmo de segunda derivada, que utiliza el
operador Laplaciano definido en [11] como:
G ( x, y ) = 4 I ( x, y) I ( x 1, y ) I ( x + 1, y ) I ( x, y 1) I ( x, y + 1) (7)
Debido a que la entrada a la red neuronal debe ser un
vector, cada imagen de prueba debe ser transformada para
su posterior anlisis. Esto se hace tomando cada fila de la
imagen y ordenndola una seguida de la otra para formar
el vector de prueba de entrada a la red.
225
Rev.Col.Fs., Vol.42, No.2 de 2010.
Referencias
226