Está en la página 1de 13

Universidad de las Fuerzas Armadas ESPE

Sede Latacunga

Departamento de Eléctrica y Electrónica


Carrera de Electrónica y Automatización

Control Inteligente - 5884

Trabajo de Investigación

Aplicaciones de las Redes Neuronales

Nombre:
José A. Bucheli C.
Docente:
Ing. Jacqueline del Roció Llanos P. Dr.

30 de mayo del 2022


1. Las Redes Neuronales Artificiales en las Finanzas.

Este artículo muestra en forma sencilla cómo las Redes Neuronales Artificiales pueden
aplicarse en las finanzas, en particular, en el área de predicción de variables económicas
financieras. En 1981, el Dr. White realizó un trabajo que ilustraba el uso de las Redes
Neuronales Artificiales en la predicción de variables financieras. Desde entonces, se ha
incrementado el estudio de las aplicaciones de las Redes Neuronales Artificiales en el
campo de las finanzas. En tal sentido, se ha aprovechado la característica de las Redes
Neuronales Artificiales, que establece que éstas pueden “aprender”.

Figura 1. Variables de entrada de una Red Neuronal Artificial para pronósticos financieros

Se puede afirmar que los parámetros para determinar la definición de la arquitectura son:

1. La división temporal de la base de datos.


Una vez que la variable de salida y el contenido de la base de datos se hayan definido, de
lo cual se obtendrán las variables de entrada, las series de tiempo históricas deberán
subdividirse en períodos de tiempo, lo que se delimitará por el proceso de aprendizaje y
evaluación.
2. El número de las capas ocultas y el número de neuronas que se va a insertar en
cada capa.
Para la determinación del número de capas, existen numerosas contribuciones,
metodologías que establecen que una sola capa oculta es suficiente para aproximar, con
un alto grado de exactitud, las funciones no lineales más recurrentes. Con relación al
número de neuronas asignadas a las capas ocultas, se debe seleccionar aquel número que
permita minimizar el riesgo de un sobre aprendizaje, que exige un mayor número de
variables de entrada, pero que no asegura tener un pronóstico más confiable.
3. Los mecanismos de conexión entre las diferentes capas.
La arquitectura conocida como Redes de Propagación hacia Atrás, o “Back Propagation”
se emplea mucho por su habilidad para generalizar resultados para un amplio número de
problemas financieros. Este tipo de arquitectura se define como supervisada, es decir,
aquella cuyo aprendizaje se ve condicionado por las variables de entrada y de salida. Las
posibilidades de conexión que existen son:

• Conexión estándar: En este caso las conexiones son entre las capas de
entrada y salida, pasando por una capa oculta, como se muestra en la
Figura 2.
• Conexión con salto: En el caso más simple, la capa de entrada se vincula,
no solamente con la capa oculta, sino también con la capa de salida, tal
como se muestra en la Figura 3.
• Conexión recurrente: En este caso las conexiones proporcionan la
posibilidad que las capas ocultas puedan retroalimentar a las variables de
entrada, mediante procesos iterativos, tal como se muestra en la Figura 4.

Figura 2. Arquitectura de propagación hacia atrás, conexión estándar

Figura 3. Arquitectura de propagación hacia atrás, conexión con salto

Figura 4. Arquitectura de propagación hacia atrás, conexión recurrente

4. La función de activación.

Las funciones típicas de activación son:


• Lineal
• Logística

• Sinusoidal
• Gaussiana

5. Las reglas de aprendizaje.


La selección de la regla de aprendizaje es problema muy particular, cuando se aplican las
Redes Neuronales Artificiales, por cuanto se tiene que decidir qué tasa de cambio de la
Red debe modificar la definición de los pesos de las neuronas. Si la tasa de cambio es
muy alta, no se puede lograr la convergencia y nos veríamos en la situación de reducir la
tasa de cambio.

El proceso de aprendizaje de la Red pasa por un proceso progresivo que permita la mejor
fijación de los parámetros correctos. La recomendación es que se eviten las variaciones
radicales de los parámetros.

6. Los indicadores de error de la Red Neuronal.


Una vez que hemos fijado las características iniciales de la Red Neuronal, se hace
necesario determinar en qué momento se debe detener el proceso de aprendizaje. Estos
criterios tienen que estar relacionados con el conjunto de pruebas. Por otro lado, los
parámetros de aprendizaje se relacionan con los indicadores de error, tales como:
• Error medio • Error máximo • Número de ciclos sin mejora en el error

Se puede fijar un valor para estos parámetros que permitan que la Red Neuronal se
detenga cuando haya alcanzado el valor deseado. Otro criterio de aceptación es la
convergencia. Si los errores se consideran modestos, pero la oscilación tiene una alta
divergencia, es oportuno verificar la adecuación de los parámetros.
2. Redes Neuronales Artificiales para el Procesamiento de Imágenes, una
Revisión de la Última Década.

El amplio uso de las redes neuronales en el campo del procesamiento de imágenes,


motiva a realizar una revisión de 200 artículos donde se documentan algoritmos que
utilizan alguna arquitectura de redes neuronales para tareas de clasificación,
reconocimiento o segmentación en imágenes digitales. Esta revisión presenta los distintos
modelos de redes, así como sus modificaciones y aplicaciones en el procesamiento de
imágenes. Luego se documentan algunos aspectos de nuevas redes neuronales incluyendo
los modelos pulsantes, se presenta el análisis de los trabajos revisados organizado por el
tipo de procesamiento que hacen las redes neuronales y finalmente se comentan las
conclusiones del estudio realizado.

Figura 5. Niveles de procesamiento


Las técnicas para analizar una imagen digital se agrupan en un área llamada
Procesamiento Digital de Imágenes. Estas herramientas se organizan según el nivel de
procesamiento que se desea realizar para analizar la información contenida en una
imagen digital. Estos niveles forman una cadena de procesamiento como la que se ve en
la figura 5. A continuación se describen brevemente:

• Pre-procesamiento. Operaciones para adaptar la información de una


imagen y tener mejor análisis en pasos posteriores. Ejemplos de
procesamiento son las operaciones de brillo y contraste.
• Segmentación. Operaciones para hacer una partición de la imagen en
varias regiones que representen la información necesaria para el
problema a resolver.
• Detección de objetos y clasificación. Determinación y clasificación de
los objetos contenidos en la imagen.
• Análisis de imagen. Obtener información de alto nivel acerca de lo que la
imagen muestra.
Por su potencial para reconocer patrones de información las RNA han sido desde hace
décadas herramientas para resolver problemas en cualquiera de los niveles del
procesamiento de imágenes. Esto debido a que las imágenes digitales contienen mucha
información difícil de interpretar por una máquina. En la literatura analizada, la mayoría
de las aplicaciones de las RNAs en imágenes digitales fueron para tareas de segmentación
y clasificación (CL). Para desglosar la información, la parte de segmentación se separó
de la siguiente manera:

• Segmentación de forma (SS). Se refiere a generar una nueva imagen


binarizada donde el resultado son regiones representativas de la
información que se desea analizar.
• Detección de bordes (CS). Extracción de altas frecuencias en la imagen
que representen contornos y límites de objetos en la imagen.
• Segmentación de color (CrS). Partición de la imagen en regiones que
agrupan colores similares.
• Segmentación de Textura (TS). Partición de una imagen con base a los
patrones de variación espacial de las intensidades de grises y color.
• Segmentación de movimiento (VS). Detección de objetos dinámicos en
una secuencia de imágenes.
También se reportaron trabajos para eliminación de ruido (NR), agrupamiento de
datos para aplicaciones específicas (Ct) y comparación entre RNAs (VR).
REDES NEURONALES Y PROCESAMIENTO DE IMÁGENES
a) Teoría de Resonancia adaptiva (ART).
b) Red Neuronal Celular (CNN).
c) Perceptrón multicapa (MLP) y Backpropagation (BP).
d) Red Neuronal Oscilatoria (ONN)
e) Red Neuronal Pulso-Acoplada (PCNN)
f) Redes neuronales Recurrentes (RNN)
g) Red Neuronal con Funciones de Base Radial (RBFNN)
h) Redes Neuronales probabilísticas (RPNN)
i) Mapa Auto-Organizado de Kohonen (SOM)
j) Redes Pulsantes (SNN)

Figura 6. Tipo de Procesamiento Realizado por las RNA

3. Reconocimiento de Voz con Redes Neuronales, DTW y Modelos Ocultos de


Márkov.

En este artículo se aborda el diseño de un reconocedor de voz, con el idioma español


mexicano, del estado de Aguascalientes, de palabras aisladas, con dependencia del
hablante y vocabulario pequeño, empleando Redes Neuronales Artificiales (ANN por sus
siglas en inglés), Alineamiento Dinámico del Tiempo (DTW por sus siglas en inglés) y
Modelos Ocultos de Markov (HMM por sus siglas en inglés) para la realización del
algoritmo de reconocimiento.

4. Redes Neuronales Artificiales y Árboles de Decisión para la Clasificación con


datos categóricos.
Las redes neuronales artificiales (RNA) y los árboles de decisión (AD) se han
utilizado como clasificadores en distintas áreas, como en el sector salud, financiero,
manufactura, social entre otros. Sin embargo, cada uno de estos clasificadores tiene sus
ventajas dependiendo del tipo de datos (numérico, categórico o mezclados) de entrada.
Por lo tanto, los árboles de decisión trabajan con valores tanto numéricos como
categóricos. Teóricamente ambos clasificadores pueden trabajar con todos los tipos de
datos, sin embargo, en la práctica no parecer ser así. Por esta razón en este trabajo se
realiza un análisis de las ventajas y desventajas de estos clasificadores para valores
categóricos. Se utilizaron bases de datos descritas en atributos de tipo categórico, que
fueron codificadas, para la RNA. De acuerdo con las pruebas realizadas la eficiencia de
clasificación cuando se utilizó la RNA es inferior al clasificador C4.5.
Figura 7. Metodología

Obtención de las bases de datos:

• Evaluación de carros: la cual está descrita en 6 características categóricas las


cuales son: Compra, Mantenimiento, Puertas, Personas, Arranque y Seguridad
con 4 clases (Accesible, Inaccesible, Bueno y Muy bueno) con un tamaño
1728 automóviles (objetos).
• Defectos en autos: se describe en 4 características categóricas las cuales son:
Modulo, Coordenada, Modelo y Tipo de defecto, con 3 clases (Ensamble,
Carrocerías y Pintura) con 543 objetos.
• Juego de ajedrez: se describe en 36 características categóricas, las cuales
representan las posiciones en el juego, con dos clases (ganar o perder) con
3196 jugadas (objetos).
• Base de Juego xox: cuenta con 9 atributos categóricos para describirlo, que
son las posiciones del juego, con dos clases (juego positivo o juego negativo),
con 958 juegos(objetos).
• Cáncer de pecho: Se describe en 5 características de tipo categórico
(Menopausia, Nodos-capas, Pecho, Irradiación) y 4 de tipo numérico (Edad,
Tamaño del tumor, Nodos inv, Maligno), con dos clases (recurrente y
norecurrente) con 286 diagnósticos (objetos).
Diseño de la red neuronal artificial
La Red Neuronal Artificial utilizada se presenta en la figura 8, donde la estructura
de la RNA es utilizada es la misma solo cambiando las entradas y salidas debido a las
diferentes características y clases. Todas las bases de datos se codificaron con los dos
métodos anteriormente expuestos para ser implementados en la RNA en Python,
representa las neuronas de entrada dependiendo de las características que tenga la
base de datos a utilizar, las capas ocultas con 4,10,10 neuronas y la capa de salida con
neuronas las cuales son las clases.

Figura 8. Red Neuronal Artificial

Árbol de decisión con el algoritmo C4.5

Para cada uno de los conjuntos de datos se construyó su respectivo árbol de decisión
utilizando el algoritmo C4.5, para esto se trabajó con el software Weka. Por razones de
espacio solo se presenta el árbol de decisión obtenido de la base de datos “evaluación de
carros”, mostrado en la figura 9, también se puede observar que el nodo que obtuvo la
mayor “ganancia de información” fue la característica “seguridad”.

Figura 9. Ejemplo de árbol de decisión C4.5 en la base evaluación de carros.


Resultados

Figura 10. Resultados de los métodos de clasificación en las 5 bases de datos.

En la base de datos “Evaluación de carros”, se utilizaron 1210 muestras en el


entrenamiento y 518 objetos para la prueba, de los cuales clasifico correctamente 470
objetos, obteniendo una exactitud del 90%.
Para la base de datos “Defectos en los autos” se ocuparon 380 objetos para
entrenamiento y 163 de prueba, en el cual clasifico 160 objetos dando una exactitud del
98% en este proceso.
En la base de datos “Juego de ajedrez” se tuvo una exactitud en la clasificación
del 99%, con 2237 objetos para entrenamiento y 959 de prueba.
Como se observa todas las bases de datos obtuvieron una mejor exactitud en los
árboles de decisión con algoritmo C4.5 para realizar la clasificación.
Conclusión
De los resultados obtenidos en esta investigación podemos concluir que, el algoritmo
C4.5 obtuvo mejores resultados en las 5 bases de datos utilizadas, mostrando que para
datos categóricos y bases de datos con muestras reducidas se obtiene buenos resultados,
mientras que los resultados obtenidos con la red neuronal fueron mejores en bases de más
de 1000 muestras con codificación entera.
Las redes neuronales que utilizaron codificación activa, en la mayoría de los datos no fue
viable realizarla, debido a que las exactitudes obtenidas para realizar este proceso no
fueron óptimas, en la figura 10 se presenta la comparación de los resultados obtenidos
por cada método y por cada base de datos.
Finalmente podríamos decir que los árboles de decisión proporcionan mejores resultados
en comparación de las redes neuronales artificiales cuando los conjuntos de datos están
descritos en características categóricas. Esto debido a que para utilizar una red neuronal
se requiere realizar los datos categóricos a numéricos.
5. Redes Neuronales para Modelar Predicción de Heladas.
En este trabajo se desarrollaron modelos basados en redes neuronales del tipo
“backpropagation”, para predecir la ocurrencia de heladas, a partir de datos
meteorológicos de temperatura, humedad relativa, nubosidad, dirección y velocidad del
viento. El entrenamiento y la validación de las redes se realizaron utilizando 24 años de
datos meteorológicos correspondientes a la estación de Río Cuarto, Córdoba, Argentina,
separados en 10 años como conjunto de datos de entrenamiento y 14 como conjunto de
datos de validación. Se construyeron diferentes modelos para evaluar el comportamiento
de las redes cuando se usan distintos números de variables de entrada y/o neuronas en la
capa oculta y las probabilidades de aciertos en los resultados de predicción para los
mismos, al considerar distintas variables de entrada. En los modelos realizados, el
porcentaje de días con error de pronóstico fue de 2%, aproximadamente, para 14 años de
aplicación; cuando se consideran días de heladas efectivas no pronosticadas los
porcentajes oscilan entre un 10% y un 23%, para el mismo período. Los resultados de la
simulación muestran el buen desempeño y la pertinencia general de esta metodología en
la estimación de fenómenos de comportamiento no lineal como las heladas.
MATERIALES Y MÉTODOS

Una red neuronal artificial es un entramado o estructura formada por nodos o neuronas,
que se conectan entre sí y tienen la capacidad de recibir datos de entrada y producir una
salida. Las distintas redes neuronales propuestas en el presente trabajo presentan tres
capas de neuronas con propagación de la información hacia adelante, están compuestas
por una capa de entrada cuyas neuronas son Ei (en la presente aplicación, en cada una de
las cuales ingresan los parámetros como temperatura, humedad, etc.), una capa de
neuronas ocultas Oj (capa de unidades de procesamiento), cuyo número de neuronas no
necesariamente es igual al de la capa de entrada, y una capa de neuronas de salida, Si ,
que codifican el resultado del cálculo (en esta aplicación conformada por una sola neurona
que indica la decisión de helada o no). La cantidad de neuronas de la capa de salida
depende del problema a resolver. El esquema general puede observarse en el Figura 11.
Figura 11. Esquema general de conexiones de una red neuronal.

Datos meteorológicos
Los datos diarios de entrada de la RN se obtuvieron de la estación meteorológica
convencional de Río Cuarto Aero, que pertenece al Servicio Meteorológico Nacional
dependiente de la Fuerza Aérea Argentina, Región Aérea Noroeste, cuyo número de la
Organización Meteorológica Mundial (OMM) es 87453, y se encuentra ubicada en las
coordenadas geográficas 33º07’ lat. Sur y 64º14’ long. Oeste, la altitud es de 421 m.s.n.m.
El clima de la región de Río Cuarto, Córdoba, Argentina, se clasifica, según Köppen,
como Cwa, subtropical cálido húmedo con inviernos secos.

Pronóstico de heladas
El modelo general (M1) de pronóstico de heladas se implementó como una red neuronal
del tipo “backpropagation”, empleando una función sigmoidea, con tasa de aprendizaje α
= 1, tasa de momento γ = 0,5, y el parámetro β = 0,5, valores recomendados por Campbell
y Temporel (2002). El mismo se programó utilizando lenguaje C. Para la capa de entrada
y la capa oculta se utilizaron 15 neuronas. Como la función de activación utilizada fue la
sigmoidea, que entrega valores para temperaturas en todo el intervalo [0,1], se consideró
una función lineal para asignar los valores menores a 0,2 como 0 si se produce el
fenómeno de helada, y los valores mayores a 0,8 el valor 1 que corresponde a no helada,
quedando un gradiente en el intervalo (0,2, 0,8).
En el modelo 1 (M1), los datos de entrada fueron: temperatura (ºC) a nivel del abrigo de
las 14:00 h y 20:00 h, humedad relativa (%), temperatura a punto de rocío (ºC), dirección
(º) y velocidad del viento (nudos) y nubosidad (octos); los valores de estas variables se
consideran para los dos días sucesivos anteriores al que se va a pronosticar.
Figura 12. Modelos de redes neuronales para pronóstico de heladas. Variables de entrada y número de neuronas en
la capa de entrada (E) y oculta (O)

RESULTADOS Y DISCUSIÓN

Para el modelo M1, al cabo de 20.000 iteraciones, se obtuvo un error medio cuadrático
de 1,0. En el Cuadro 2 se observan los errores que se presentaron en el entrenamiento de
cada uno de los modelos, como así también la evolución de los mismos cuando se
disminuyen el número de neuronas de la capa oculta. Se puede deducir que la reducción
en el número de neuronas que constituyen la capa oculta produce un aumento en los
errores de aprendizaje, esto estaría confirmando la suposición que el fenómeno es
decididamente no lineal en su comportamiento, y de allí esta reducción dificulta la
elección de pesos, para un mismo número de iteraciones en el aprendizaje.

Figura 13. Valor del error de aprendizaje y días con error de pronóstico para los distintos modelos de redes
neuronales.
6. Bibliografía
De Luna Ortega, C. A., Martínez Romo, J. C., & Mora Gonzáles, M. (2006).
Reconocimiento de Voz con Redes Neuronales, DTW y Modelos Ocultos de
Markov. Conciencia Tecnológica, 5.
Del Carpio Gallegos, J. (2005). Las Redes Neuronales Artificiales en las Finanzas.
Facultad de Ingeniería Industrial, 5.
Origel Rivas, C. G., Rendón Lara, E., Abundez Barrera, I. M., & Alejo Eleuterio, R.
(2020). Redes Neuronales Artificiales y Árboles de Decisión para la
Clasificación con Datos Categóricos. Computing Science, 14.
Ovando, G., Bocco, M., & Sayago, S. (2005). Redes Neuronales para Modelar
Predicción de Heladas. ResearchGate, 9.
Ramírez Quintana, J. A., & Chacón Murguía, M. I. (2011). Redes Neuronales
Artificiales para el Procesamiento de Imágenes, una Revisión de la Última
Década. RIEE&C, 10.

También podría gustarte