Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad: 4 Cuatro
Actividades de aprendizaje
Actividades de enseanza
1.
Capacidad
sntesis.
de
abstraccin
Horas terico-prcticas
anlisis
y
P=2
T= 2
Habilidad para
autnoma.
Trabajo en equipo.
trabajar
y
de
en
analizar
fuentes
forma
Datos
Informacin
Conocimiento
Procesos
Conocimiento
Datos
Informacin
Se apoyan de
herramientas
como
Bases de datos
Trabajan con
Grandes
cantidades de
datos
Mtodos
matemticos
hardware y
software
informtico
INFORMACION
Conjunto de
Procesos
conocimiento
Conjunto de tcnicas que se utilizan para la obtencin de informacin implcita de las grandes bases de datos.. En
otras palabras es una tecnologa poderosa y de gran potencial que permite a las organizaciones la recoleccin de
informacin desconocida para sus propias bases (almacn de datos).
. Los modelos de minera de datos se pueden aplicar en escenarios como los siguientes:
Pronstico: clculo de las ventas
Riesgo y probabilidad: eleccin de los mejores clientes para la distribucin de correo directo,
determinacin del punto de equilibrio probable para los escenarios de riesgo, y asignacin de
probabilidades a diagnsticos y otros resultados.
Recomendaciones: determinacin de los productos que se pueden vender juntos y generacin
de recomendaciones.
Bsqueda de secuencias: anlisis de los artculos que los clientes han introducido en el carrito
de la compra y prediccin de posibles eventos.
Transformacin
Minera de
datos
Proceso
Seleccin
Conocimiento
Patrones
Data
Warehouse
Datos
procesados
Datos
transformados
PRE PROCESAMIENTO
SELECCIN DE VARIABLES
EXTRACCION DEL
CONOCIMIENTO
INTERPRETACION
1. Limpieza de datos(Crear rutinas para llenar valores nulos, duplicados, errneos e inconsistentes)
2. Integracin de los datos.(Consiste principalmente en modificaciones sintcticas llevadas a cabo sobre los
datos, sin que supongan un cambio en el significado de los mismos.)
3. Transformacin de los datos..(Conversin de datos a formas mas apropiadas para trabajar la minera de datos)
4. Reduccin de los datos....(Consiste en decidir qu datos deben ser utilizados para el anlisis)
Redes neuronales
rboles de decisin
Modelos estadsticos
Agrupamiento o Clustering
Redes Neuronales
Son un paradigma de aprendizaje y procesamiento automtico inspirado en la
forma en que funciona el sistema nervioso de los animales. Se trata de un
sistema de interconexin de neuronas en una red que colabora para producir un
estmulo de salida.
Arboles de decisin
Tcnica que utiliza la toma de decisiones secuenciales basada en el uso de
resultados y probabilidades.
VENTAJAS
Facilita la interpretacin
Explica el comportamiento
Reduce las variables
Gestiona
DESVENTAJAS
Arboles de decisin
Arboles de decisin
Arboles de decisin
Arboles de decisin
Por ejemplo:
En un escenario para predecir qu clientes van a adquirir probablemente una
bicicleta,
Arboles de decisin
Mtodos estocsticos
Es una expresin simblica en forma de igualdad o ecuacin
que se emplea en todos los diseos experimentales y en la
regresin para indicar los diferentes factores que modifican la
variable de respuesta.
Agrupamiento o Clustering
Es un procedimiento de agrupacin de una serie de vectores segn
criterios habitualmente de distancia; se tratar de disponer los vectores
de entrada de forma que estn ms cercanos aquellos que tengan
caractersticas comunes.
Ejemplos:
Algoritmo K-means.
Algoritmo K-medoids.
Algoritmo K-medias
Algoritmo K-medias
Algoritmo K-medias
Data Warehouse es una base de datos corporativa que se caracteriza por integrar,
procesar y depurar informacin de una o ms fuentes distintas.
Los datos en s mismos, carecen de sentido, ya que solo describen lo que sucede
de manera parcial y no proporcionan juicio o interpretacin, ni favorecen la toma de
decisiones.
Links consultados:
1. http://msdn.microsoft.com/
2. file:///C:/Users/optimus/Pictures/Mineria_Datos_Vallejos.pdf
Libros:
1. Base de datos de enrique Jos Reinosa, ed. alfaomega