Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo 1 Analisi Datos
Modulo 1 Analisi Datos
salayon@javeriana.edu.co
GENERACIÓN DE BÚSQUEDAS EN
IMÁGENES A PARTIR GOOGLE
DE INFORMACIÓN
Descriptiva Predictiva
Predictiva • Estimar valores futuros o desconocidos de variables de
interés
Descriptiva • Identificar patrones o relaciones en los datos
Técnica
• Enfoque conceptual elegido para lograr cumplir con una de las tareas de la
minería.
• Presenta una de las formas de poder manipular los datos para obtener
Información descriptiva o predictiva.
• Árboles de decisión.
• Clustering.
• Reglas de asociación.
• Redes neuronales.
• Patrones secuenciales.
Algoritmo
• Implementación de una técnica
• Secuencia de pasos a ser materializados en un lenguaje de programación.
◼ Árboles de decisión
◼ ID3
◼ CHAID
◼ C.4.5
◼ CART
Técnica Algoritmo
Reglas de asociación Apriori
Fast Distributed Mining of association rules
• Descriptiva agrupamiento
• Agrupamiento basado en distancias
• Vecino más cercano
TÉCNICAS PRINCIPALES
Cuatro
técnicas
principales
CLASIFICACIÓN
◼ La clasificación es una de las tareas más utilizadas.
Pertenece a las tareas predictivas.
◼ Cada registro pertenece a una clase, la cual se indica
mediante el valor de un atributo y es denominada
clase de instancia.
◼ Este atributo toma valores categóricos. El resto de los
atributos se utiliza para predecir la clase.
• Tipos de clientes en una compañía
• Tipos de flores
EJEMPLOS • Categorías de películas
• Solvencia crediticia
Modelo de clasificación
◼ Una vez tengo el modelo este examina las características de un nuevo objeto y
lo asigna a una de las clases de instancia (variable discreta).
◼ ¿Cómo se hace?
◼ Clasificar las coberturas de tierras (cuerpos de agua, áreas urbanas, bosques, etc.)
utilizando datos satelitales
Clustering Particional
basado en Centroide
utilizando el algoritmo k- Clustering Herarquico,
means Aglomerativo
Ejemplos
◼ Existe gran variedad pero la formulación más común es del estilo “si el atributo X
toma valor b entonces el atributo Y toma valor d”.
◼ Las reglas de asociación no implican una relación causa y efecto, es decir, puede
no existir una causa para que los datos estés asociados.
◼ Minería de procesos
◼ Logs de transacciones
◼ Minería web
◼ Uso
◼ Estructura
◼ Contenido
◼ Minería prescriptiva
◼ Recomienda uno o varios itinerarios de acción y muestra
posibles consecuencias de cada decisión.
2. Factibilidad Técnica
❑ Arquitectura de TI
❑ Datos disponibles
❑ Herramientas de minería
Factores de éxito de proyectos de Minería
3. Factibilidad Económica
❑ Existe un impacto significativo
❑ No se conocen métodos alternativos
❑ No existen problemas de legalidad o
violación de la información.
Factores de éxito de proyectos de Minería
Data Mining-Kantardzic
¿De dónde provienen los Datos
para hacer Minería de datos?
◼ Bodega de Datos
◼ “Colección de datos orientada a temas, dinámica, integrada,
histórica y no volátil que soporta el proceso de toma de
decisiones.” W. H. Inmon
◼ Datos Externos
VENTAJAS Y DESVENTAJAS
Ventajas y Desventajas
◼ Ventajas
◼ Desventajas
✓ Confidencialidad.
¿Por qué fracasan los proyectos de minería de
datos?
1. Datos no apropiados (Empresa)
66