Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Monografı́a: Aplicaciones de Redes Neuronales en Data Mining
Monografı́a: Aplicaciones de Redes Neuronales en Data Mining
71 Seminario de Ingenierı́a en
Informática I
Monografı́a: Aplicaciones de redes
neuronales en Data Mining
Ottavianoni Natan, Padron Nro. 86249
natan85@gmail.com
Figura 1:
Figura 2:
2
Al clasificador se lo puede interpretar como una función que mapea cada
atributo X en una clase Y, predefinida. Los métodos mas comunes para llevar
adelante esta tarea son:
Neural network
Support vector machines
Figura 3:
accuracy
predicciones correctas
accuracy =
total de predicciones
error rate
predicciones incorrectas
errorrate =
total de predicciones
3
2.2. Clustering
Es como Clasificación pero los grupos no están definidos de antemano, por
ello también se conoce con el nombre de clasificación no supervisada. Es muy útil
en etapas tempranas del análisis para sumarizar data por ej, cuando no se tiene
conocimientos de las caracterı́sticas de los datos con los que se está trabajando.
K-means
Agglomerative Hierarchical Clustering
DBSCAN
Existen diferentes tipos de Clusters:
Well-Separated
Prototype-Based
Graph-Based
Density-Based
Shared-Property (Conceptual Clusters
2.3. Regresión
Su objetivo es encontrar una función que permita modelar los datos con un
error mı́nimo
4
2.4. Reglas de asociación
Dado un conjunto de transacciones, hallar reglas que permitan predecir la
ocurrencia de un item basado en la ocurrencia de otros items en la transacción.
Es una implicación de la forma X → Y , donde X e Y son itemsets (conjunto de
items).
Support count: es la frecuencia de ocurrencia de un itemset.
3. Redes neuronales
A grandes rasgos hay dos tipos de modelos de redes neuronales: las super-
visadas como el perceptron multi capa y las no supervisadas como la red de
Kohonen. Una red supervisada usa un data de entrenamiento para armar el
modelo, se va comparando la salida con el valor esperado, si difieren se ajustan
los pesos w del sistema. Este proceso continúa hasta que se alcance el punto de
salida determinado por el algoritmo de entrenamiento. Las redes supervisadas
sirven en procesos de clasificación y predicción mientras que redes no supervi-
sadas son buenas en clustering. Las redes neuronales tienen cierta plausibilidad
biológica pero no son una copia totalmente fehaciente de las neuronas biológicas.
En esta monografı́a no se tratará el paralelismo entre las neuronas artificiales
y las biológicas y siempre que se refiera a redes neuronales se tratará de las
primeras.
5
Figura 5: En la figura se observa un modelo de comportamiento muy usado, la
neurona posee una serie de entradas producto de la interconexión con las otras
neuronas del sistema, ella suma todas las entradas y si da un valor que supera
el umbral dispara.Este modelo es de naturaleza estocástica y no lineal.
6
6. Aplicaciones a data mining
6.1. Self-Organizing Maps (SOM)
Esta red fue introducida por Teuvo Kohonen y sus aplicaciones incluyen
varios campos de la ciencia y la tecnologı́a como procesos industriales, sistemas
de telecomunicaciones, reconocimiento de imágenes etc etc,
Figura 6:
7
6.3. feed forward
Figura 7:
8
En problemas con una gran complejidad aparente pero que claramente
convergen a un tipo de solución.
6.4. Neuro-Fuzzy
Una red Neuro Fuzzy puede ser un interpretada como un sistema feed for-
ward de 3 etapas.
Figura 8:
9
7. Conclusiones
Esta monografı́a pretendió ser una introducción a las aplicaciones de redes
neuronales en data mining, para ello se menciono brevemente las distintas etapas
del procesos de minar datos y luego se presento a las redes neuronales desde una
visión cualitativa, detallando en que tipo de escenarios son mas apropiadas.
Referencias
[1] Ms.Smita.Nirkh, Potential use of Artificial Neural Network in Data Mining.
[2] John Hertz, Anders Krogh, and Richard Palmer, Introduction to the
Theory of Neural Computation, Addison Wesley, 1991.
[3] Efraim Turban, Ramesh Sharda, Jay E. Aronson,David King..:Business In-
telligence: a Managerial Approach, Prentice Hall, 2007
10