Está en la página 1de 33

INDICE

1. INTRODUCCION
2. OBJETIVOS GENERALES
3. ESTADOS DEL ARTE
4. MARCO TEORICO
5. APLICACIONES
6. CONCLUSIONES
7. BIBLIOGRAFIA

1
1. INTRODUCCION

¿QUÉ ES UNA NEURONA?

Una neurona es un gran y potente procesador de información, cabe destacar su


capacidad de aprender, procesa, combina y compara la información almacenada
del día a día a gran velocidad, además con esa información almacenada es capaz
de desarrollar habilidades, como deportes sin instrucciones explicitas de ello.
Los científicos al ver su gran potencial, ayudados de las matemáticas intentaron
simular su funcionamiento y capacidad de aprender. Estos modelos se basaron
en las características principales de las neuronas y sus conexiones.
Desarrollaron las llamadas Redes Neuronales Artificiales, estas no son un
modelo alejado de las neuronas biológicas, pues son muy interesantes por su
capacidad de reconocer patrones parecidos, lo que nos permite resolver
dificultades en la programación tradicional, con el paso de los años se fueron
complicando los modelos de estos llegando a ser paradigmas en la computación,
equivalente a la máquina de Turing.
Los modelos de Redes Neuronales Artificiales se pueden clasificar como:
 MODELOS DE TIPO BIOLÓGICO:
Redes que tratan de simular los sistemas neuronales biológicos asi
como las funciones auditivas o algunas funciones básicas de la visión.
 MODELOS DIRIGIDOS A APLICACIONES:
Modelos menos dependientes de los sistemas biologicos. Modelos en
donde sus arquitecturas estan fuertemente ligadas a las necesidades de
las aplicaciones.

2
2. OBJETIVOS GENERALES

 Tener una idea de qué es una red neuronal.


 Comprender acerca de cómo se originan.
 Identificar sus componentes y para qué sirven cada una de ellas.
 Conocer sobre cómo es su funcionamiento.
 Ejemplos de aplicaciones, en la vida diaria, en las industrias, etc.
 Identificar en que campos de investigación se puede usar las Redes
Neuronales.
 Descubrir en que aspecto de nuestra vida diaria, nos puede ayudar la
intervención de las Redes Neuronales.
 Entender el por qué es tan necesario aplicar las Redes Neuronales a
nuestra vida diaria.
 Entender qué es y cómo operan las Redes Neuronales.
 Identificar en que campos de investigación se puede usar las Redes
Neuronales.
 Descubrir en que aspecto de nuestra vida diaria, nos puede ayudar la
intervención de las Redes Neuronales.
 Entender el por qué es tan necesario aplicar las Redes Neuronales a
nuestra vida diaria.
 Entender a mayores rasgos qué es y cómo operan las Redes Neuronales.

3
3. ESTADOS DEL ARTE

Las nuevas teorías de procesamiento de información buscan cubrir las carencias


que muestran los sistemas actuales de cómputo en la resolución de diversos
problemas, los cuales son cada vez más complejos y sofisticados, debido a la
gran cantidad de variables que deben manejar y a la dificultad intrínseca del
problema. La inteligencia artificial es un claro ejemplo de esto, y de cómo
dichas teorías van desplazando a las actuales pues presentan una mejor eficacia
en estos campos. Dentro de este grupo, se encuentran las redes neuronales
artificiales, las cuales pretenden emular el comportamiento del cerebro en el
procesamiento de información. Estas redes se conforman de varios elementos de
procesamiento simples llamados neuronas, quienes se encuentran conectadas
entre sí y procesan la información con un paralelismo masivo, logrando resolver
varios y diversos problemas en distintas aplicaciones de diferentes áreas. Para
tal fin, las redes neuronales son implementadas tanto en software como en
hardware según la aplicación. De esta forma, si es una actividad estática, se
cuenta con un computador y el tiempo de procesamiento no es crítico, una
aplicación en software será la adecuada; mientras que si se requiere un
procesamiento veloz o en tiempo real, se necesita de un equipo portátil, ligero y
de pequeñas dimensiones, una implementación en hardware es la mejor opción.
Según esto, el desarrollo de redes neuronales implementadas en hardware
presenta un amplio campo de acción tanto a nivel industrial como comercial.
Por ello en el siguiente apartado realizaremos una revisión bibliográfica o la
revisión de la literatura que existe sobre nuestro tema, es decir, las
investigaciones que se hallan hecho tanto a nivel nacional como internacional
sobre Redes Neuronales o sus aplicaciones realzadas en los últimos años.

3.1 INVESTIGACIONES NACIONALES

IMPLEMENTACIÓN DE UN SISTEMA DE INFORMACIÓN


PARA EL RECONOCIMIENTO DE CARACTERES BASADO
EN LA RED NEURONAL PERCEPTRON

- PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ “FACULTAD DE CIENCIAS E


INGENIERÍA”
Sammy Nahín Carranza Hernández
Septiembre de 2014

4
El presente proyecto tuvo como objetivo final construir un sistema basado en el
funcionamiento de redes neuronales para el reconocimiento de caracteres
dibujados a mano. El proyecto se divide en 2 fases. La primera fase es la de
entrenamiento. En esta fase se entrena al sistema con el algoritmo resilient
backpropagation. Para esto se trabaja con una data de entrenamiento, los cuales
son una seguidilla de dibujos de caracteres hechos a mano. Al final de la fase de
entrenamiento se obtiene los parámetros del sistema de red neuronal, con los
cuales se podrá configurar el sistema de red neuronal. La siguiente fase es la
fase de testeo. En esta fase se busca saber cuan efectivo ha sido el proceso de
entrenamiento del sistema de red neuronal. Para esto, se pone a prueba el
sistema ingresándole nueva data la cual nunca ha sido vista por el sistema. A
esta data, se le llama data de testeo. Al final de esta fase se obtiene el grado de
efectividad del sistema en reconocer acertadamente cada carácter ingresado al
sistema.

OBJETIVO GENERAL

Arquitectura Multilayer Perceptron (MLP) Implementar un sistema de


información para el reconocimiento de caracteres basado en la red neuronal
Perceptron.

OBJETIVOS ESPECÍFICOS

1. Implementar el software de extracción de características del archivo de


imágenes y normalización del archivo de objetivos.
2. Implementar el software de configuración y entrenamiento de la red
neuronal para obtener los pesos y las vías de la red neuronal.
3. Diseñar el proceso de reconocimiento de dígitos dentro de la red
neuronal.
4. Implementar el prototipo de sistema de información para el
reconocimiento de dígitos.

ALCANCE
Este es un proyecto de investigación aplicada que busca entrenar e implementar
un prototipo de reconocimiento de caracteres basado en redes neuronales, el
cual se hará cargo de leer un archivo que contiene una secuencia de imágenes de

5
dígitos de 28x28 píxeles en escala de grises. El prototipo final no realizará la
segmentación de caracteres de ningún documento. El prototipo no tratará con
ninguna otra extensión de archivo de entrada que no sea la base de datos de
dígitos del MNIST. Una parte de la fase del entrenamiento será hecha usando
una función del programa MatLab.

CONCLUSIONES

Al finalizar este proyecto, se concluye que las redes neuronales son útiles para
cualquier problema de clasificación, como por ejemplo el reconocimiento de
caracteres, siempre y cuando haya data suficiente para el entrenamiento y que
esta data sea una buena representación de todo el universo de la data. También
se concluye que el método Nguyen - Widrow es un buen método para mejorar y
acelerar la fase de entrenamiento. Sin embargo, a pesar de que este prototipo
soporta el procesamiento con varias capas (más de 2), no se pudo superar la
eficacia de la arquitectura antes mencionada en otras arquitecturas de tres capas
o más, tal vez, porque no se halló ni en la experimentación realizada en el
proyecto ni en la literatura la cantidad necesaria óptima de neuronas por capa.

CLASIFICACIÓN DE LA SALINIDAD DEL SUELO


MEDIANTE IMÁGENES DE SATÉLITE Y LAS REDES
NEURONALES ARTIFICIALES.

- Universidad Nacional Mayor de San Marcos, Rolando Renee Badaracco Meza y Joel Rojas
Acuña , Octubre 2013

Los procesos de cambio climático han llamado obligatoriamente la atención de


la ciencia en las últimas décadas, situaciones como la desertificación y sequia
son temas de gran importancia. De aquí se desprendió la necesidad de estudiar
la salinidad de los suelos y el índice de vegetación de diferencia normalizada
(NDVI) usando imágenes de los sensores ETM+ y TM, estas imágenes fueron
procesados usando el software ENVI 4.5 y el lenguaje de programación IDL.
Para este propósito se implementó una red neuronal artificial con arquitectura de
retropropagación de error, que permita clasificar la salinidad en los suelos,

6
usando como datos de entradas imágenes de NDVI, y datos de entrenamiento de
conductividad eléctrica del suelo. Las áreas de estudio fueron la comisión de
regantes Muy Finca y los distritos de Lambayeque y Mórrope que pertenecen a
la región Lambayeque-Perú. Para la arquitectura de la red neuronal se utilizó 2
capas ocultas presentando un error de entrenamiento de 0.27, estos resultados
fueron evaluados usando la matriz de confusión, el índice de kappa y el índice
de exactitud global, obteniéndose un índice de kappa de 0.92 y el índice de
exactitud global fue de 94.74%. Finalmente se obtuvo una imagen clasificada de
la distribución espacial de la salinidad en los suelos, la clasificación tuvo como
resultado 3196.26 has como suelos muy fuertemente salinos, 2818.53 has como
suelos fuertemente salinos, 3918.96 has como suelos moderadamente salinos,
10296.63 has como suelos ligeramente salinos y 2349.36 has como suelos no
salinos.

INTRODUCCIÓN
Los estudios de salinización en Lambayeque son escasos, por lo que no
se cuenta con información necesaria y actualizada; sin embargo, en el
Valle Chancay-Lambayeque se han realizado en distintos periodos
evaluaciones de salinidad de suelos con resultados sorprendentes y
desalentadores como se muestra en la Tabla 1, [1]. La conductividad
eléctrica del suelo (CE) ha sido el parámetro más extendido y el más
ampliamente utilizado en la estimación de la salinidad. La CE refleja la
concentración de sales solubles en la disolución. Para la clasificación de
la salinidad del suelo se utilizó la Tabla 2 en donde muestra los rangos de
la CE en extracto de 1:1.

7
REDES NEURONALES Y PERCEPTRÓN MULTICAPA
El término red neuronal se aplica a una familia de modelos relacionada de
manera aproximada que se caracteriza por un gran espacio de parámetro y
una estructura flexible y que proviene de los estudios sobre el
funcionamiento del cerebro. En la Figura 1 se muestra la gráfica
arquitectónica de un perceptrón multicapa con dos capas ocultas y una
capa de salida. La red que se muestra aquí está totalmente conectada. Esto
significa que una neurona en cualquier capa de la red tiene una dirección
hacia delante, de izquierda a derecha.

UBICACIÓN DE LAS ÁREAS DE ESTUDIO


Las áreas de estudio fueron la comisión de regantes Muy Finca y los
distritos de Lambayeque y Mórrope que pertenecen a la región
Lambayeque que está ubicada en la costa norte del Perú. En la Figura 2 se
muestra la ubicación de las 3 áreas de estudio.

8
Las imágenes utilizadas fueron de los satélites Landsat 5 y Landsat 7, estas
imágenes fueron obtenidas gracias a la cortesía de la United States Geological
Survey (USGS), en total se utilizaron 46 imágenes, 3 imágenes del satélite
Landsat 5 y 43 imágenes del satélite Landsat 7.
Adquisición de muestras de campo En las áreas de estudio se ubicó puntos de
muestreo debidamente georeferenciadas con la ayuda de un GPS. Se extrajo las
muestras de suelo de 0.0 - 0.30 m de profundidad, que fueron trasladadas al
laboratorio de suelos de la Facultad de Agronomía de la UNPRG, en donde se
determinó la Conductividad Eléctrica de 190 muestras distribuidas como se
muestra en la Tabla 3.

CONCLUSIONES

La presente metodología cumplió con los objetivos de clasificar la salinidad en


los suelos con el uso de imágenes de satélite y los datos in situ de conductividad
eléctrica. El NDVI es un parámetro físico muy importante ya que está

9
relacionado con la conductividad eléctrica del suelo. Se recomienda que para
futuras investigaciones las muestras de campo deban ser tomadas en plena fase
terminal o final de su desarrollo vegetativo (al 50% de la floración), etapas en
que las plantas desarrollan la más intensa actividad fisiológica, poseen una
mayor cobertura vegetativa y en consecuencia se logra un mayor reflejo de la
luz solar. Ya que en esta época, el efecto de la sales del suelo en las raíces de las
plantas y en toda la planta es mayor que en etapas fisiológicas previas, por lo
que es más fácil discriminar las áreas afectadas.

10
UN SISTEMA BASADO EN REDES NEURONALES
ARTIFICIALES PARA DIAGNÓSTICO DE ANEMIA
FERROPÉNICA

- Universidad Nacional Mayor de San Marcos , Facultad de Ingeniería de Sistemas e


Informática , Edinson Muñoz, Jorge Espinoza, Luis Rivera, 2012.

Los médicos confunden el hecho de identificar los tipos de anemias con otras
enfermedades, generando casos irreversibles en muchos casos. Frente a esto, se
plantea un sistema inteligente basado en Redes Neuronales Artificiales para el
Diagnóstico de Anemia Ferropénica y sus similares Megaloblástica y
Hemolítica, dado que sus síntomas y factores en la fase inicial son parecidos, de
manera que permita auxiliar al profesional de salud a tomar acciones adecuadas.
Para ese propósito, se establece una metodología propia con la adecuación de la
arquitectura clásica de un sistema experto a una basada en redes neuronales.
Como resultado se obtiene un 99% de certeza en los diagnósticos realizados
durante la evaluación del sistema.

MODELO DE LA RED NEURONAL

La topología de las redes


neuronales propuestas para la
anemia Ferropénica,
Megaloblástica y Hemolítica
que se tratan en este trabajo,
que se muestra en la Figura , es
del tipo de red Multicapa
Unidireccional o Perceptrón
Multicapa (MPL), conformada
por 4 capas (1 entrada, 2
ocultas y 1 salida), con 27
neuronas de entrada en la
primera capa, de acuerdo a las
variables de entrada
determinadas; con 2 capas
ocultas con 40 y 27 neuronas,
respectivamente, determinadas

11
por pruebas realizadas en donde se evaluaron la eficiencia de acuerdo a los
factores de entrenamiento resultantes, estas capas representan básicamente el
nivel de inferencia óptima de la red neuronal para determinar la respuesta; y una
neurona en la capa de salida. En esta red se aplicará el algoritmo de aprendizaje
Backpropagation, usado generalmente con el modelo MPL. Observe que las 27
neuronas de entrada consideradas en la primera capa equivalen a la entrada de
los 27 factores ya analizados para el diagnóstico de las anemias.

CONCLUSIONES
Se ha propuesto una alternativa tecnológica computacional para el diagnóstico
de la anemia ferropénca incluyendo las anemias megaloblástica y hemolítica. La
propuesta tecnológica consiste en un sistema basado en redes neuronales
artificiales. El modelo de redes neuronales artificiales contempla 27 factores que
constituye la capa de entrada, dos capas ocultas con 40 y 27 neurona
respectivamente, y una capa de salida que corresponde al diagnostico. La
validación realizada (ver sección 5) muestra que el sistema construido tiene un
certeza de 99% en sus resultados, con ello se logra la confianza del usuario
necesario para este tipo de sistema. Como trabajos futuros aún queda poder
realizar un sistema de diagnóstico de los diferentes tipos de anemias que
existen, poder unificarlos y que trabajen en forma conjunta. Debido a que cada
anemia cuenta con diferentes números de características a la hora de tomar un
diagnóstico, ello implicaría que diferentes redes trabajen en forma colaborativa.

3.2 INVESTIGACION INTERNACIONAL

PREDICCIÓN DEL NIVEL COGNITIVO EN ESTUDIANTES


SECUNDARIOS ECUATORIANOS MEDIANTE EL USO DE REDES
NEURONALES ARTIFICIALES
- Escuela Politécnica Nacional, Departamento de Formación Básica, Ecuador , R. Cueva, E.
Bone

Para predecir el nivel cognitivo de estudiantes secundarios se utilizaron redes


neuronales artificiales (RNA), las redes neuronales abordan problemas que a
menudo son difíciles de resolver, como el habla y reconocimiento de patrones,
pronósticos del clima, pronósticos de ventas, programación de circuitos de

12
autobuses, pronóstico de carga de energía, el uso de RNA dentro del área de la
educación no es nuevo, su uso ha sido probado entregando resultados acertados
en los casos aplicados. Su utilización inicia en los primeros años del siglo XXI y
se ha recurrido a esta herramienta para predecir, por ejemplo, índices de
aprobación en centros educativos, lo que facilita el manejo y la planificación de
la actividad escolar, se ha usado además para predecir índices de abandono
escolar y determinar qué factores son los mayormente influyentes, entre otras
aplicaciones [8]. Las RNA son el método más general de análisis de regresión.
Algunas de las ventajas de la red neuronal sobre la regresión convencional es
que utilizan algoritmos de aprendizaje adaptativo ya que se actualizan
fácilmente a medida que aumentan los datos históricos, es decir se extiende su
base de conocimiento. El procesado de datos en las RNA es no lineal 16th
LACCEI International Multi-Conference for Engineering, Education, and
Technology: “Innovation in Education and Inclusion”, 19-21 July 2018, Lima,
Peru. 2 lo que incrementa su capacidad para aproximar funciones y aumentan su
inmunidad frente al ruido.

ENTRENAMIENTO DE UNA RNA


Para inicializar el proceso de entrenamiento de una red neuronal multicapa es
necesario definir el número de capas ocultas y su número de neuronas por capa.
En la Fig. 2 se muestran las dimensiones de la RNA utilizada en este trabajo.
Una vez que se tenga definida la dimensión de la red, se debe escoger el método
de entrenamiento. De los métodos de entrenamiento destaca la regularización
Bayesiana, basada en el método Levenberg- Marquard, útil para pequeñas
muestras de entrenamiento y que además pueden presentar ruido[22]. El ajuste
de los parámetros se basa en métodos de minimización del MSE. Para obtener
criterios de rendimiento de la red, se debe considerar el error cuadrático medio
del conjunto de datos de entrenamiento y validación. Este tipo de entrenamiento
o regulación, requiere de un tiempo de entrenamiento relativamente más largo
que otros métodos, pero constituye una regulación robusta, disminuyendo el
problema de sobreentrenamiento de la red neuronal.

13
METODOLOGÍA
En este apartado se describe la metodología utilizada. Para establecer la base de
datos requerida para el entrenamiento de la red neuronal se consideraron los
resultados de las pruebas PISA para las áreas de matemática, lengua y ciencias
en los años 2006, 2009, 2012 y 2015, de los países participantes de la prueba
PISA. Se analizó con mayor detalle los resultados obtenidos por países
latinoamericanos participantes: Argentina, Colombia, Chile, Perú y Uruguay;
los valores se obtuvieron de la base de datos de la OCDE. Los datos de nivel
cognitivo se determinaron como promedio por país de los puntajes obtenidos en
las áreas de matemática, lengua y ciencias de las pruebas PISA. Para los datos
de los siguientes factores socioeconómicos: tasa de fertilidad adulta, tasa de
embarazo adolescente y tasa de mortalidad para menores de 5 años se consideró
el año de nacimiento de los estudiantes participantes en la prueba PISA, es decir
restando 15 años del año correspondiente a la prueba . Para la información sobre
los años de educación de los padres se consideró un rango de 19 a 25 años de
diferencia con relación al año en el que se realizó la prueba PISA; los demás
factores se determinaron para el año correspondiente a la realización de la
prueba PISA. Se utilizó como fuente de información para cada factor
socioeconómico las estadísticas de indicadores del Banco Mundial por país.
Para el entrenamiento de la red neuronal multicapa se contó con ocho datos de
entrada correspondientes a cada uno de los factores socioeconómicos
enumerados anteriormente, y con un parámetro de salida, que es la media de
valor cognitivo por país. Se definió una red con una capa de entrada con ocho
neuronas y una capa de salida con una neurona. La base global de datos se
dividió aleatoriamente en tres subconjuntos, un conjunto de datos para el
entrenamiento, para validación y para el test, a razón de 70%, 15% y 15%
respectivamente. Selección de neuronas en las capas ocultas No existe una regla
que defina el número de capas y de neuronas por capa que deba tener una red
neuronal para cada aplicación, sin embargo, un parámetro que debe tomarse en
cuenta es el MSE generado por del conjunto de datos para el entrenamiento con

14
el conjunto de datos de validación. Mediante un proceso iterativo para encontrar
la RNA que presente un menor error de estimación, se determinó que la red
debe estar conformada por 2 capas ocupas, con 5 neuronas en la primera capa
oculta y 2 neuronas en su segunda capa oculta, a más de la capa de entrada que
cuenta con 8 neuronas y la capa de salida que cuenta con 1 neurona, como ya se
mencionó. Para el diseño y entrenamiento de la red neuronal se utilizó el
programa de simulación MATLAB. El método de entrenamiento seleccionado
fue la regularización Bayesiana.
CONCLUSIONES
Mediante los resultados de este estudio se determinó que el modelo de RNA, es
adecuado para la predicción del nivel cognitivo de los estudiantes ecuatorianos,
estos resultados fueron comparados con los obtenidos por regresión lineal en el
trabajo realizado por Almachi, J. et al comprobando con ello la precisión de los
datos. El modelo propuesto está constituido por una red neuronal multicapa, con
una capa de entrada conformada por 8 entradas, 2 capas ocultas, con 5 neuronas
en la primera y 2 neuronas en su segunda capa y una capa de salida conformada
por 1 neurona. El mecanismo de aprendizaje seleccionado fue la regularización
Bayesiana. Con el modelo establecido en el presente trabajo se logró una
adecuada estimación del nivel cognitivo de los estudiantes de los países
considerados. Se obtuvo un máximo error porcentual del 7.0% en el año 2006, y
un mínimo de 3.9% para el año 2009. Según el presente estudio al considerar
los factores socioeconómicos detallados anteriormente, como determinantes en
la predicción del nivel cognitivo, los estudiantes ecuatorianos obtuvieron un
valor de 403 para el año 2015. El uso de redes neuronales para predicción de
datos constituye un método confiable y provee de información válida para la
toma de decisiones. Mediante los resultados del presente estudio y comparado
con los datos de países de Latinoamérica que presentan un mayor nivel
cognitivo como Chile y Argentina, es posible inferir que para que en el Ecuador
se pueda incrementar su nivel cognitivo es necesario adoptar medidas que
fortalezcan o que mejoren las condiciones de vida de los futuros estudiantes, por
ejemplo, dotación de medicamentos, de alimentos en la etapa prenatal y en la
infancia temprana para grupos de riesgo o vulnerabilidad y campañas de
estimulación temprana.

15
4. MARCO TEÓRICO

Las Redes Neuronales fueron originalmente una simulación abstracta de los


sistemas nerviosos biológicos, constituidos por un conjunto de unidades
llamadas neuronas o nodos conectados unos con otros. El primer modelo de red
neuronal fue propuesto en 1943 por McCulloch y Pitts en términos de un
modelo computacional de actividad nerviosa. Este modelo era un modelo
binario, donde cada neurona tenía un escalón o umbral prefijado, y sirvió de
base para los modelos posteriores.

Características Principales de las Redes Neuronales:

 AUTO-ORGANIZACIÓN Y ADAPTABILIDAD:

Una red neuronal presenta un grado de adaptabilidad que se concreta en


las capacidades de aprendizaje y generalización. Entendemos por
aprendizaje la capacidad de recoger información de las experiencias y
utilizarlas para actuar ante situaciones futuras, es decir, sometemos a la
red neuronal a cambios en las que se pueda adaptar y a través de esas
experiencias ganadas, esta es capaz de realizar acciones similares a las
anteriores.

 PROCESADO NO LINEAL:

Las neuronas o los nodos que forman parte de las redes son
esencialmente elementos no lineales. De esta manera la red resultante
también lo es. Históricamente la mayoría de los sistemas de procesado
de la información han sido construidos utilizando dispositivos lineales,
ya que han resultado más fáciles de estudiar y construir aunque por ello
ciertos problemas intrínsecamente no lineales no han podido ser
suficientemente bien tratados. Por consiguiente las redes neuronales
pueden rellenar aquellos vacíos que los sistemas de procesado lineales
no han podido ocupar.

16
 PROCESADO PARALELO:

Debido a la naturaleza masivamente paralela de los modelos


neuronales es posible acelerar considerablemente el cálculo que
deben realizar. Además esta misma característica les hace candidatos
ideales para ser implementados utilizando tecnología VLSI.

 CAPACIDAD DE LIBRE MODELO:

Las Redes Neuronales Artificiales pueden estimar una función sin


necesidad de conocer un modelo matemático que nos diga de qué
manera las salidas dependen de las entradas. De hecho muchos
modelos neuronales pueden ser estudiados dentro de la inferencia
estadística no paramétrica, ya que estiman a partir de los datos
diferentes estadísticas sin asumir un modelo probabilístico concreto.

 TOLERANCIA A FALLOS:

Habitualmente podemos encontrar que en muchas redes neuronales


la degradación de su respuesta frente a condiciones adversas (por
ejemplo en caso de que algunas conexiones o neuronas fallen) no es
abrupta sino suave. Es decir a medida que van fallando más partes la
respuesta se ha degradado poco a poco.

17
5. APLICACIONES DE REDES NEURONALES

Están ligadas al tema de inteligencia artificial. Tienen como inspiración el


comportamiento del cerebro humano. Buscan solucionar problemas difíciles de
resolver utilizando algoritmos matemáticos convencionales.

ROBÓTICA
ROBOTS CON DETECTORES DE OBSTÁCULOS
Un robot es un dispositivo automático que realiza acciones específicas, que
dependen de las necesidades del proceso en que se encuentre involucrado, en
este caso se tiene un robot que cuenta con cuatro sensores de proximidad en
distintas ubicaciones que permanentemente detectan si hay objetos que se
encuentren a una distancia superior o inferior a la preestablecida, con base en
esto se decide si dar marcha adelante o atrás a cada uno de los dos motores que
posee; en las lecturas de los sensores podrían darse 16 posibles combinaciones
(16= 24 ) y para cada combinación cada uno de los dos motores podría dar
marcha adelante o marcha atrás.

El comportamiento del robot lo describe la tabla siguiente, cuando los sensores


detecten un objeto que se encuentra a una distancia inferior a la predeterminada
se dirá que el objeto se encuentra cerca y esto se representa por medio de un 1 y
cuando se detecte un objeto que se encuentra a una distancia mayor que la
predeterminada se dirá que el objeto está lejos lo cual se indica con un –1;

18
dependiendo de estas lecturas los motores podrán dar marcha adelante, lo que se
representara por un 1 o dar marcha atrás con un –1.

S1 y S2 = 1…objeto cerca S1 y S2 = -1…objeto lejos

M1 y M2 = 1…motor adelante M1 y M2 = -1… motor reverso

JUSTIFICACIÓN DEL TIPO DE RED


Este tipo de problema generalmente es resuelto suministrándole al robot una
base de datos que contiene todas las posibles situaciones que se podrían
presentarse y sus respectivas soluciones, en este caso se necesitaría almacenar
las respuestas para ambos motores ante las 16 posibles combinaciones en las
lecturas de los sensores, cuando el número de variables de entrada y el número
de salidas es mucho mayor, la cantidad de datos necesarios para especificar cada
posible situación crece indefinidamente, debido a esto se requerirían
dispositivos con gran capacidad de almacenamiento; en contraste una red
neuronal puede entrenarse con un número representativo de patrones y aprender
el comportamiento del sistema utilizando dispositivos de menos capacidad de
almacenamiento y costo.
Una red tipo Perceptrón puede ser entrenada con patrones de cualquier
dimensión en la entrada y en la salida con datos binarios, por la simplicidad del
problema este tipo de red es la mas adecuada.
Para garantizar que el problema puede ser resuelto por una red neuronal tipo
Perceptrón se debe comprobar que los patrones de entrenamiento son
linealmente separables, para esto se deben plantear las desigualdades generadas
por cada patrón de entrenamiento, en este caso cada patrón de cuatro
dimensiones generara dos desigualdades (una por cada salida), estas

19
desigualdades no deben contradecirse, si esto ocurriera el problema no podría
ser resuelto por una red tipo Perceptrón de una sola capa y deberá buscarse otro
tipo de solución.
Debido a la naturaleza bipolar de la salida, la función de transferencia a utilizar
es hardlims (ver sección 1.3.2), la cual se rige por las siguientes
condiciones.
𝑛≥0 𝑎=1
( )
𝑛 < 0 𝑎 = −1
La salida de la red está dada por la ecuación
N=Wp + b
Aplicando esta ecuación a cada patrón de entrenamiento se tienen las
desigualdades de la tabla, las cuales se satisfacen plenamente, lo que implica
que el problema es linealmente separable y puede ser resuelto por una red tipo
Perceptron.

ENTRENAMIENTO DE LA RED:
A la red se le presentaran 7 patrones de la tabla, para los cuales dependiendo de
las lecturas de los sensores se le dirá al robot que hacer específicamente y luego
se probará la red con los casos restantes para comprobar la capacidad de
generalización de la red neuronal ante un patrón nunca antes visto. Los estados
de lecturas de los sensores y de operación de los motores fueron designados con
1 y –1, puesto que para la convergencia del proceso de entrenamiento resulta
más ventajosos propagar valores de 1 y –1 que de 1 y 0. Debido a la naturaleza

20
de la salida y de la entrada de la red, la función de transferencia apropiada es
hardlims, la cual trabaja con valores bipolares.

Se creará una red de 4 entradas con una neurona tipo Perceptrón para cada
salida, teniendo así una salida bidimensional, los pesos iniciales aleatorios de la
red se muestran en la tabla.

El siguiente código crea una red tipo Perceptrón con función de transferencia
hardlims, dos neuronas en la salida, utiliza como patrones de entrenamiento las
lecturas de los cuatro sensores almacenados en p y como patrones objetivo o
salidas deseadas las acciones de ambos motores almacenados en el vector t.

net=newp([-1 1;-1 1;-1 1;-1 1],2,'hardlims');


net.adaptParam.passes=200;
Wi;
[net,a,e]=adapt(net,P,t);
Wf=net.IW{1,1};
bf=net.b{1};

Los pesos finales de la red entrada que satisface todos los patrones de entrada y
salida son

21
La red fue simulada para la totalidad de combinaciones posibles de entrada para
comprobar que no exista error en el aprendizaje de los patrones de
entrenamiento y para observar su capacidad de generalización en los casos
restantes.

S1= [1 -1];
S2= [1 -1];
S3= [1 -1];
S4= [1 -1];
P=combvec( S1, S2,S3,S4);
net=newp ([-1 1; -1 1; -1 1; - 1 1],2,'hardlims');
Wf;
t=sim(net,P);

La respuesta de la red a todos los patrones de entrenamiento fue exitosa, como


puede observarse en la tabla.

La red fue simulada para las posibles combinaciones restantes obteniéndose los
siguientes resultados:

22
Las combinaciones que no hacían parte del set de entrenamiento, al ser
presentadas a la red fueron aproximadas al patrón del set de entrenamiento
aprendido con menor distancia euclidiana. Para las combinaciones C1, C2 y C4
la red decidió dar marcha adelante a ambos motores; para la combinación C5 la
red decidió dar marcha atrás a ambos motores, para las combinaciones C6, C7 y
C9 la red decidió dar marcha adelante a M1 y marcha atrás a M2 y para las
combinaciones C2 y C8 la red decidió dar marcha atrás a M1 y marcha adelante
a M2 Una red tipo Perceptrón de una sola capa es una buena solución a un
problema que involucre patrones linealmente separables, en el caso de contar
con patrones que no son linealmente separables se tiene la alternativa de utilizar
una red Perceptrón multicapa o cambiar definitivamente de red, nótese que una
red Perceptrón multicapa puede solucionar el problema de separabilidad lineal a
medida que aumenta el número de capas de la red.
La capacidad de generalización de las redes neuronales juega un papel
importante cuando las posibles combinaciones de patrones de entrada son tantas
que resultaría imposible especificarle a un dispositivo que hacer en cada caso,
puesto que la red se entrena con un número de patrones representativo y no con
la totalidad de ellos, ahorrando tiempo de computo en la solución del problema.
En las aplicaciones desarrolladas con redes neuronales juega un papel
importante la tolerancia a fallas que las caracteriza, pues en caso de fallar uno o
varios sensores (como en este caso) la red siempre producirá una salida que en
la mayoría de los casos es la más acertada, debido a que la red después de un
proceso de aprendizaje exitoso está en capacidad de generalizar el
comportamiento del sistema.

RECONOCIMIENTO FACIAL

23
Los inimitables patrones de tu rostro podrán servir hasta para sacar dinero de
un cajero automático. Los sistemas de reconocimiento facial están invadiendo
eventos, tiendas e incluso iglesias mientras Facebook
quiere identificarte incluso cuando no ve tu cara. Pero ¿cómo sabe quién eres o
cómo te sientes un ordenador?
En primer lugar, el sistema tiene obviamente que detectar que somos un ser
humano, rastreando los píxeles de la imagen. "Hay algoritmos que, a partir de
un conjunto de imágenes que son caras y otro conjunto que no son caras, son
capaces de aprender automáticamente a encontrar una cara en una imagen".

Después, llega la fase de alineación: se determina la posición o el tamaño de la


cabeza para poder normalizarla. Habitualmente, la cara se alinea detectando dos
puntos característicos, como pueden ser la posición de los ojos, aunque los más
sofisticados métodos estiman también la inclinación de la cabeza o la
iluminación. Cuando los rostros están alineados, el sistema procede rápidamente
a extraer las características con las que puede reconocer quiénes somos.
algunos 'software' se fijan en las características globales de nuestra cara,
como la forma (si es más o menos alargada o más o menos redonda) o la
configuración general de nuestro rostro (si tenemos una frente muy hundida o
unas cejas muy salientes). "Estos sistemas no se fijan en puntos concretos de la
cara, sino que toman la fotografía e intentan compararla con la anterior", se
asemeja el sistema con una "lupa" buscando diferencias en nuestro rostro.
Los primeros sistemas de reconocimiento facial comparaban las dos imágenes
"en bruto", píxel a píxel, una labor demasiado costosa y poco efectiva, por lo

24
que actualmente nuestra cara se transforma en vectores para reducir la
dimensionalidad y extraer la información discriminante de las caras.

Otro tipo de sistemas de reconocimiento analizan características locales. Lo


normal es que detecte los ojos, la nariz y la boca, y a partir de ahí se calcula el
resto de los puntos de la cara. Detectar la T que forman nuestros ojos y nuestra
nariz, una tarea relativamente fácil para un sistema, sirve tanto para alinear
nuestra cara previamente como para analizar el resto de puntos interesantes y
medir las distancias, consiguiendo extraer las características geométricas de
nuestros rostros.
A un nivel más alto, los sistemas intentan sacar similitudes, como la distancia
entre puntos característicos de la cara, la medida de tu ojo o la distancia del
ojo a la nariz.
Utilizar un modelo 3D de nuestra cara es otra de las alternativas, aunque hay
dos opciones distintas: crear un modelo tridimensional de la cabeza del sujeto
utilizando varias cámaras o fotografiarle directamente con una cámara 3D.
La profundidad permite así mejorar la comparación posterior de las
imágenes.
Los programas tradicionales combinan diferentes tipos de métodos para extraer
tanto características globales como locales, y el color o la iluminación de la
escena también se tienen en cuenta. No hay un número específico de datos que
se deban extraer para conocer tu fisonomía, aunque Cabello puntualiza que
con unos cuantos miles, una máquina ya debería ser capaz de reconocernos.
Una vez extraídas las características o patrones de nuestra cara, el sistema de
clasificación (un algoritmo previamente entrenado) busca similitudes con las

25
fotografías de su base de datos. Cuanto más complicado es el escenario, el
rendimiento de los sistemas tiende a bajar.
Un reconocedor facial realiza el control de los trabajadores de una empresa, éste
funcionará siempre con el mismo fondo. En cambio, un sistema comercial en un
escenario no controlado, como pueda ser una estación de tren, debe ser mucho
más sofisticado, puesto que tiene que hacer frente a un mayor número de
casuísticas.

RECONOCIMIENTO DE PATRONES
El reconocimiento de patrones tiene muchos campos de investigación, por
ejemplo: así como en la grafología que busca el reconocimiento de cifras
escritas a mano, en el campo de la antropología con el reconocimiento de restos
fósiles antiguos y el reconocimiento de rostros humanos, en el campo de la
agricultura el reconocimiento de ciertas plagas como las plagas de escarabajos
entre el follaje, en el campo de la micromecánica con el reconocimiento de la
posición de ciertas piezas metálicas, etc.

APLICACIONES EN MICROMECÁNICA
Para las primeras investigaciones, se realizaron tareas de aplicación de redes
neuronales en micromecánica, entre ellas, el reconocimiento de texturas
metálicas o reconocimiento de posiciones de flecha y orificio en la tarea de
micro ensamble.
Por ejemplo, en la tarea de micro ensamble es necesario saber la posición exacta
de micro pieza relativamente a un orificio pues son trabajos que requieren de
gran precisión.
Con lo anterior, se ha logrado demostrar que con el sistema de visión
computacional es posible reconocer la posición de la pieza y colocarla en el
punto exacto requerido.
Uno de los componentes micro mecánicos producidos por las micro máquinas
son los micro tornillos. Éstos son componentes necesarios construir mecanismos
en miniatura.

26
APLICACIONES EN LA AGRICULTURA
DETECCIÓN DE PLAGAS
Se trata de un proyecto enfocado al desarrollo de un instrumento de búsqueda,
de detección y reconocimiento de plagas, en específico del escarabajo de
colorado en cultivos de papas aplicando clasificadores neuronales artificiales.
Los escarabajos de colorado son considerados una amenaza para las cosechas de
hojas de papas, tomates y berenjenas porque se alimentan de esos cultivos. Los
pesticidas no siempre pueden eliminar las plagas ya que el escarabajo de
colorado genera una rápida resistencia a nuevas fórmulas volviéndose inmunes
a ellos con facilidad.
En los últimos 50 años, los escarabajos de colorado generaron resistencia a más
de 25 diferentes pesticidas. Una alternativa es la eliminación mecánica, para ello
es necesario desarrollar algoritmos de reconocimiento de escarabajos y sus
larvas en ambiente natural.

27
CHIPS DE SILICIO

Otro de los campos de la investigación en el mundo de las ANN al margen de


los simuladores software y aceleradores hardware, es la integración de todos los
componentes de computación neuronal en un chip de silicio. Un ejemplo
concreto es el chip Electronic Neural Network (EEN) de la compañía AT&T
que contiene 256 transistores-neuronas y más de 100.000 resistencias-sinapsis.
Actualmente este chip está siendo utilizado para aplicaciones de compresión del
ancho de banda de imágenes de vídeo para poder ser transmitidas por una línea
telefónica. Existen muchas compañías y centros de investigación que están
trabajando en el desarrollo de circuitos integrados que realizan computación
neuronal. La mayoría de las aplicaciones de estos chips está siendo la
simulación de procesos sensitivos como la visión de imágenes y la audición de
sonidos.

APLICACIONES EN LA INDUSTRIA ROBÓTICA

28
Los robots y máquinas inteligentes cada día ocupan gran parte del sector
industrial, estas máquinas están remplazando muchos de los trabajos que antes
era hecho por humanos, estos modelos de robots en la actualidad se van
asemejándose más y más a muchas de las características de las personas. Tienen
extremidades y de similar tamaño, son igual o más rápidos y también asemejan
su fuerza, lo único que no había sido integrado era la toma de decisiones, pero
se hará gracias a las redes neuronales.

Desde hace más de dos décadas, se trabaja en la aplicación de Redes


Neuronales Artificiales (RNA) en robots empleados en la industria, con el
objetivo de que las máquinas puedan reformular sus líneas de trabajo de acuerdo
con las necesidades de la empresa. Este proceso imita el funcionamiento de
las redes neuronales de los organismos vivos. Al igual que la complejidad
del cerebro, un conjunto de neuronas conectadas entre sí y que trabajan en un
conjunto, sin que haya una tarea concreta para cada una, estas neuronas van
creando y reforzando ciertas conexiones para aprender algo que se queda fijo en
el tejido. Por ejemplo:

 ROBOTS PLAY-BACK: los cuales regeneran una secuencia de


instrucciones grabadas, como un robot utilizado en recubrimiento por spray
o soldadura por arco. Estos robots comúnmente tienen un control de lazo
abierto.

 ROBOTS CONTROLADOS POR SENSORES: estos tienen un control en


lazo cerrado de movimientos manipulados, y hacen decisiones basados en
datos obtenidos por sensores.

29
APLICACIONES EN LA MEDICINA

PRÓTESIS
Muchas de las investigaciones que se han realizado en el campo de las
interfaces neuronales se han enfocado al control y a la ejecución de funciones de
mecanismos efectores. Algunos de los más estudiados son: neuroprótesis,
exoesqueletos, robots telemétricos y, de manera especial, sistemas de
comunicación directa con computadores. Estos permitirían la sustitución de
partes corporales, la restitución de funciones para las que se ha perdido
capacidad, la realización de tareas en ambientes inaccesibles para los humanos,
entre otras funciones.

N E U RO PR Ó T E S I S

La neurociencia analiza la posibilidad de reemplazar algunas funciones del


sistema nervioso usando dispositivos artificiales. Esto se logra mediante la
creación de modelos matemáticos biológicamente realistas de las funciones del
cerebro, la producción de microchips biomiméticos que incorporan estos
modelos y su integración al sistema nervioso central.

El dispositivo más usado en neuroprótesis es el implante de cóclea, utilizado


para restaurar el oído; sin embargo, también existen implantes que permiten
restaurar la visión e incluso funciones cognitivas, en un lado al cerebro en el
último caso.
La transmisión sináptica también ha sido analizada mediante la utilización de
neuroprótesis con excelentes resultados, lográndose traducir los impulsos
neuronales y enviando señales por radiofrecuencia se puede mover el mouse de
una PC, una silla de ruedas eléctrica y hasta prótesis biónicas. Las conexiones

30
sinápticas de los nervios ‘redireccionados’ hacia electrodos también permiten
captar sensaciones de los miembros perdidos.

31
6. CONCLUSIONES

Las redes neuronales artificiales , inspirados en el comportamiento del cerebro


humano, permiten la creación de la inteligencia artificial . Notablemente
aplicados en el análisis de datos, principalmente a través de aprendizaje no
supervisado, se utilizan para predecir, identificar y clasificar
datos. el aprendizajeEl motor esencial del sistema, les permite asimilar el
procesamiento de la información a través de una función y reproducirla para los
datos que luego se le presentarán. Las redes neuronales se usan ampliamente en
finanzas y administración como una herramienta de apoyo a la decisión, pero
pueden ser útiles para muchas otras aplicaciones en áreas que van desde la
arqueología hasta la medicina y la medicina. telecomunicaciones. Además,
resultan ser prometedores para quien los inspiró: el cerebro humano.

32
7. BIBLIOGRAFIA:

1. (Anderson, 1995) Anderson, James A,"An Introduction to Neural


Networks", MIT Press, 1995.
2. https://monitor.iiiepe.edu.mx/notas/%C2%BFpor-qu%C3%A9-las-redes-
neuronales-artificiales-son-el-futuro.
3. http://www.redes-neuronales.com.es/tutorial-redes-neuronales/que-son-
las-redes-neuronales.htm.
4. http://www.varpa.org/~mgpenedo/cursos/scx/archivospdf/Tema1-0.pdf.
5. http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema3dm.
pdf.
6. https://www.youtube.com/watch?v=U1toUkZw6VI
7. https://www.youtube.com/watch?v=aircAruvnKk&t=749s
8. https://www.youtube.com/watch?v=ILsA4nyG7I0
9. http://ciencia.unam.mx/leer/773/redes-neuronales-artificiales-
contribuyen-en-el-desarrollo-de-aplicaciones-en-beneficio-humano
10.http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S1909-
97622007000100004
11.http://files.uladech.edu.pe/docente/02659781/IA/S03/01_CONTROL_RO
BOT.pdf
12.http://oa.upm.es/215/1/10200404.pdf
13.http://repositorio.espe.edu.ec/bitstream/21000/4939/1/T-ESPE-
033009.pdf
14.http://www.redalyc.org/html/145/14503005/
15.http://revistasinvestigacion.unmsm.edu.pe/index.php/sistem/article/view/
5613/4870
16.https://dialnet.unirioja.es/servlet/articulo?codigo=6299787
17.https://dialnet.unirioja.es/servlet/articulo?codigo=4814376
18.https://revistas.unal.edu.co/index.php/bolma/article/view/34992
19.http://cybertesis.uni.edu.pe/handle/uni/97
20.http://alicia.concytec.gob.pe/vufind/Record/PUCP_4f960a75347827a884
0a31a772e202d3
21.https://elcomercio.pe/blog/vidayfuturo/2017/12/la-importancia-de-las-
redes-neuronales

33

También podría gustarte