Está en la página 1de 27

Álvaro J.

Méndez – Services Engagement Manager IBM SPSS / Profesor Econometría UAM


Jecas, 22 Oct 2010

Aplicaciones prácticas de Minería de Datos con


IBM SPSS Modeler

Business Analytics software


© 2010 IBM Corporation
Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

2 © 2010 IBM Corporation


Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

3 © 2010 IBM Corporation


Business Analytics software

IBM SPSS: posicionamiento en el mundo del análisis predictivo

IBM SPSS: Reconocida como líder en Análisis


Predictivo
 Las aplicaciones de IBM SPSS tiene una buena
visibilidad y fuerza de ventas en el mercado, con
marcada visión analítica de CRM
 IBM SPSS es considerada como el mejor proveedor de
data mining - muy focalizado en CRM
 IBM SPSS es percibida como la compañía más
visionaria en el mercado

 94% de los clientes alcanzaron un ROI positivo, con un regreso


de la inversión en 10.7 meses.
 El 90% de los usuarios atribuyen un incremento de su
productividad a IBM SPSS
 81% de los proyectos se acabaron a tiempo, 75% bajo
presupuesto previsto.
“Este es uno de los ROI más altos que Nucleus ha visto es sus
informes de “Real ROI Series” Rebecca Wettemann, VP de
Research, Nucleus ResearchSPSS

4 © 2010 IBM Corporation


Business Analytics software

Minería de Datos (Data Mining) y Análisis Predictivo

Minería deTexto

Análisis Predictivo

Informes Estadística

© 2010 IBM Corporation


Business Analytics software

Resultados de Minería de Datos incluyen

 Clasificar sujetos y objetos en grupos


reconociendo patrones / basándose en sus
atributos
 Asociar qué eventos ocurren habitualmente
de forma simultánea
 Secuenciar qué eventos normalmente
llevan a otros
 Predicción de lo que puede ocurrir en el
futuro

© 2010 IBM Corporation


Business Analytics software

Lo ideal….

¡¡PELIGRO!!
EL SISTEMA PREDICE UN ATAQUE BIOLÓGICO(PROB. 78.7%)
FECHA: 17-19 DIC 10
LUGAR PROBABLE: BUITRAGO DE LOZOYA
OBJETIVO PROBABLE: RECINTO PÚBLICO – ESTADIO
DEPORTIVO – RECINTO DE JUEGOS
PERFIL DEL ATACANTE: NORTEAMERICANO, MÚLTIPLES
ENTRADAS RECIENTES, SIN ANTECEDENTES PENALES

© 2010 IBM Corporation


Business Analytics software

Pero ….

 La Minería de Datos no es una tecnología mágica


 Necesita datos: Limpios, organizados, procesados
 Necesita ser aplicada con objetivos específicos en mente
 Herramienta usada por analistas con conocimientos en el campo
específico

© 2010 IBM Corporation


Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

9 © 2010 IBM Corporation


Business Analytics software

¿Qué no es Minería de Datos?

 Triturar datos por la fuerza bruta


 Aplicación “ciega” de algoritmos
 Intentar encontrar relaciones donde no
existen
 Presentar datos en diferentes formatos
 Una tarea que demande recursos
intensos de base de datos
 Una tecnología difícil de comprender
que necesite de un avanzado
conocimiento de informática

© 2010 IBM Corporation


Business Analytics software

Minería de Datos es …

 Una palabra de moda para técnicas que


encuentran patrones de datos
 Un proceso interactivo orientado al usuario
que utiliza conjuntamente tecnologías
análiticas con potencia computacional
 Un grupo de técnicas que encuentran
relaciones que no habían sido encontradas
previamente
 No dependiente de una base de datos
existente
 Una tarea relativamente sencilla que
requiere de conocimiento del
problema/asunto/negocio
© 2010 IBM Corporation
Business Analytics software

Minería de Datos vs. Análisis Estadístico

Minería de Datos Análisis Estadístico


– Menos interesado en los – Pruebas sobre validez
mecanismos de cada técnica de modelos
– No necesita de asunciones – Pruebas de hipótesis
• ¿Es la relación significativa?
hechas sobre los datos
– Normalmente se basa en muestras
– Puede encontrar patrones en seleccionadas
cantidades enormes de datos – Las técnicas no están optimizadas
– Necesita comprensión y para grandes cantidades de
conocimiento de los datos y de información
los problemas tratados

© 2010 IBM Corporation


Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

13 © 2010 IBM Corporation


Business Analytics software

Preguntas clave sobre Minería de Datos

 ¿Cuál es el problema fundamental que se quiere resolver?


 ¿Qué fuentes de datos están disponibles y qué partes de
las mismas son relevantes al problema actual?
 ¿Qué tipo de preprocesamiento y limpieza de la
información se necesita hacer antes de comenzar el
proceso de minería?
 ¿Qué técnica de Minería de Datos va a usar?
 ¿Cómo va a evaluar los resultados de su análisis de
Minería de Datos?
 ¿De qué manera va a sacar el mayor provecho de la
información que obtenga del proceso de Minería de
Datos?

14 © 2010 IBM Corporation


Business Analytics software

Proceso CRISP-DM

15 © 2010 IBM Corporation


Business Analytics software

Estrategia para la Minería de Datos: Metodología CRISP-DM

 www.crisp-dm.org. 6 fases:
1. Comprensión del Problema
• Determinar los objetivos globales
• Evaluar la situación actual
• Elaborar un plan de desarrollo
2. Comprensión de los Datos (Recolección, Descripción, Exploración y Valoración)
3. Preparación de la información
• Extraer los datos de diferentes fuentes
• Fundir varias tablas de datos en una sola
• Combinar datos de distintas fuentes
• Identificar datos perdidos, anómalos o valores
• Seleccionar los datos de interés
• Reestructurar los datos en el formato requerido
• Transformar los datos en otros nuevos
4. Modelado
• Seleción de las técnicas de modelizaje
• Determinación de los diseños de prueba
• Construcción y validez de los modelos
5. Evaluación (Resultados, Revisión del proceso, Próximos pasos)
6. Explotación (Uso del modelo, Informe final, Revisión del proyecto)
16 © 2010 IBM Corporation
Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

17 © 2010 IBM Corporation


Business Analytics software

20 Aplicaciones posibles

1. Optimización de campañas de marketing sobre varios


productos y canales
2. Modelización de marcha de empleados en empresas
3. Identificación de estudiantes en riesgo en colegios
4. Compañía que descubre las mejores películas para los
clientes, basándose en sus elecciones anteriores
5. Detección de Riesgo de fraude en reclamación de seguros
de automóviles

18 © 2010 IBM Corporation


Business Analytics software

20 Aplicaciones posibles

6. Análisis de navegación de páginas web para detectar


caminos habituales: ¿cuál es el próximo enlace más
probable?
7. Análisis de delitos y comportamientos violentos, con
grabaciones de actividad en Internet y teléfono por la Policía,
para detectar amenazas criminales
8. Administración de Categorías en Hipermercados: encontrar la
mejor localización para productos en los lineales
9. Análisis y planificación de Promociones: características de
clientes más proclives a responder a futuros mailings
10. Clasificación correcta de tumores cerebrales en niños
19 © 2010 IBM Corporation
Business Analytics software

20 Aplicaciones posibles

11. Optimización de contratación de personal en empresas


12. Predicción e identificación de la conducta y gasto de un
consumidor durante un período de tiempo tras el cual deja de
comprar en una cadena
13. ¿Quiénes son los 10 clientes que me ofrecen el mayor potencial
de beneficio?
14. Detección de anomalías en el comportamiento online de
usuarios para predecir futuros delitos electrónicos.
Complementado con el análisis de conductas en redes sociales
15. Detectar actividad fraudulenta en el uso de tarjetas de crédito

20 © 2010 IBM Corporation


Business Analytics software

20 Aplicaciones posibles

16. Detección del momento preciso en que un cliente abandonará o


cambiará de proveedor telefónico
17. Análisis de reclamaciones de garantía de productos
18. Predicción de componentes que fallarán para abastecerse a
tiempo de los recambios: predicción del siguiente problema
19. Análisis de texto para mejora de las presentaciones realizadas
por farmacéuticas a médicos: características comunes a
médicos que mejor responden a ofertas de farmacéuticas
20. Predecir con cierta probabilidad un espacio temporal en el que
podría producirse un paro cardíaco en aquellos sujetos con
enfermedad del corazón
21 © 2010 IBM Corporation
Business Analytics software

Aplicaciones e Industrias

Servicios Financieros
- Contratación
- Retención
- Cross-sell y Up-sell
- Fraude

Minería
de Datos

- Fraude
- Recaudación
- Satisfacción
ciudadano

Sector Público
© 2010 IBM Corporation
Business Analytics software

¿Qué ténicas están disponibles en IBM SPSS Modeler?

 Segmentación (K-medias, Kohonen, Bietápico, Anomalía)


 Asociación (A priori, GRI, CARMA, Análisis de Secuencia)
 Clasificación (Factorial, Discriminante, Red Neuronal, C5.0, GLM,
Máquinas de Vectores de Soporte, Redes Bayesianas, Modelos de auto
aprendizaje, Vecino más próximo, Árboles, Listas de Decisión, Selección de
características)

 Predicción (Regresión Lineal, Series Temporales, Regresión de Cox,


Regresión Logística

 Automáticos (Auto numérico, Auto clasificador, Auto Agrupación,


Modelizador ARIMA automático)

23 © 2010 IBM Corporation


Business Analytics software

Agenda

 Minería de Datos y Análisis Predictivo


 ¿Qué es y qué no es Minería de Datos?
 Proceso estándar: CRISP-DM
 Aplicaciones e Industrias
 Demo IBM SPSS Modeler 14

24 © 2010 IBM Corporation


Business Analytics software

Portfolio IBM SPSS

 IBM SPSS Statistics (SPSS)


 IBM SPSS Data Collection
(Dimensions)
 IBM SPSS Modeler (Clementine)
 IBM SPSS Decision Management
(PES)

25 © 2010 IBM Corporation


Business Analytics software

IBM SPSS Modeler 14


Visualización

Rutas,
Resultados,
Modelos

Modelado
Acceso a
los datos

Transformación

Distribución

Proyecto

Evaluación

Nodos

26 © 2010 IBM Corporation


Business Analytics software

¿Preguntas?

alvaro.mendez@es.ibm.com

27 © 2010 IBM Corporation

También podría gustarte