Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase1A IntroduccionMD
Clase1A IntroduccionMD
1
Agenda
1. Definición y evolución
2. Madurez analítica
3. Casos de éxito
4. Conceptos relacionados
Agenda
1. Definición y evolución
2. Madurez analítica
3. Casos de éxito
4. Conceptos relacionados
Definición minería(analítica) de datos
• Analítica de datos
– Es la práctica y arte de analizar datos para apoyar la toma de
decisiones.
• Ciencia de los datos
– Es el conjunto de principios fundamentales que guían la
extracción de conocimiento a partir de los datos.
2019
Data science and machine
learning platforms
Evaluación de herramientas- Gartner
2016
Advanced Analytics Platform
Evaluación de herramientas- Gartner
2016
Data Science Platforms
Generadores de Datos
Stephens ZD, Lee SY, Faghri F, Campbell RH, Zhai C, Efron MJ, et al. (2015) Big Data: Astronomical or Genomical? PLoS Biol 13(7): e1002195.
Generadores de Datos
Volumen
Velocidad
Variedad
1. Estructurados
2. No estructurados
3. Semi-estructurados
Analítica y Big Data
• Big Data es usado para describir montos grandes de datos diversos, tanto
estructurados como no estructurados, a los cuales las organizaciones pueden
acceder de manera rápida, para analizarlos usando herramientas innovadoras,
que en conjunto, ayudan a determinar con precisión oportunidades de mejora
en la gestión y en la generación de valor
• Big Data es un paradigma que busca dar soluciones a problemas que involucren
las tres V
IBM2017
Analítica y Big Data: Vs extendidas
Big Data – Desafios técnicos
1. Definición y evolución
2. Madurez analítica
3. Casos de éxito
4. Conceptos relacionados
Madurez analítica
Agenda
1. Definición y evolución
2. Madurez analítica
3. Casos de éxito
4. Conceptos relacionados
Casos de éxito - Netflix
Decisiones:
Qué series/películas comprar, qué series mantener?
Qué recomendar?
Qué trailers utilizar?
Cómo lograr que
usemos más el
servicio?
Datos usados:
Más de 86 millones de usuarios
• Qué ve?
• Cuándo hace pausa, adelanta, pasa rápido?
• Qué días y a qué hora ve películas?
Las personas que ven más de 15 horas al mes tienen • Dónde ve, qué dispositivo usa, cómo busca qué
menos probabilidad de cancelar la suscripción. ver?
• Información de las películas: actores, directores,
Los que ven menos de 5 horas al mes tienen más género, etc.
probabilidad de cancelar (95%) • Información de series más pirateadas
Casos de éxito - Netflix
Decisiones:
Qué alimentos generar
nuevos para necesidades de los
las
responder a
consumidores?
Cómo llegar a los nuevos consumidores a
través de las marcas?
Segmentos más específicos de consumidores
Objetivo:
Perfilamiento digital de los consumidores y segmentación según sus características
Casos de éxito - CAOBA
Casos de éxito - CAOBA
1. Definición y evolución
2. Madurez analítica
3. Casos de éxito
4. Conceptos relacionados
Procesamiento de BD vs. Analítica de Datos
• Consulta • Consulta
• Bien definida • Definida vagamente
• SQL
• No hay un lenguaje de consulta específico
• Se usan
• Hay que preparer los datos
• Datos • Datos
• Operacionales • No operacionales
• Deben ser preparados
• Salida • Salida
• Precisa • Difusa
Aprendizaje
de
Máquina
Visualización
Inteligencia de negocios
Analítica de
Reportes OLAP Dashboards
datos
¿Qué es Open Data?
• http://index.okfn.org/
Plataformas Open Data
Para promover la filosofía Open Data se han creado plataformas web que permiten tener disponibles datos, reportes
y herramientas de interés para la comunidad.
Ejemplos:
www.data.gov, www.data.gov.uk, www.data.gouv.fr
www.opendata.socrata.com
http://www.datos.gov.co/
Problemas y Oportunidades
• Naturaleza abierta y gratuita puede generar problemas de
confidencialidad
• Falta de estándares de publicación a pesar de la existencia
del Open Data Protocol
• Multitud de dominios y autores genera problemas de
integración y estandarización
• Extraer metadatos no es sencillo
• Las estrategias de visualización no están adaptadas a quien debe usar la información generada a partir de los
datos
• Enlace entre datos (Linked Data)
Minería de Datos vs. KDD
KDD
Preparación Minería de Evaluación/
Patrones Interpretación/ K
SI de los datos
datos Visualización
41
Gracias
pomares@javeriana.edu.co
apomares
Referencias
1. Aplicación de técnicas de minería de datos en la construcción y validación de modelos predictivos y asociativos a partir de
especificaciones de requisitos de software. María N. Moreno García, Luis A. Miguel Quintales, Francisco J. García Peñalvo y M. José
Polo Martín. Fernando Virseda Benito, Javier Román Carrillo. Minería de datos y aplicaciones.
2. Aplicación de la minería de datos en la evaluación de la aptitud física de las tierras para el cultivo de la caña de azúcar. Saddys Segrera,
María N. Moreno, Luis A. Miguel.
3. Student dropout analysis with application of data mining methods.Mario Jadrić ,Željko Garača, Maja Ćukušić.
4. Tratamiento de datos personales y derechos fundamentales. Garriga, Ana. Madrid: Dykinson, 2004
5. Customer churn analysis in telecommunication sector. Umman Tuğba Şimşek Gürsoy, Istanbul University Journal of the School of
Business Administration http://journals.istanbul.edu.tr/, 2010
6. Anna L. Buczak and Christopher M. Gifford. 2010. Fuzzy association rule mining for community crime pattern discovery. In ACM SIGKDD
Workshop on Intelligence and Security Informatics (ISI-KDD '10). ACM, New York, NY, USA, , Article 2 , 10 pages.
7. Data mining for intelligence led policing. http://www.sentient.nl/docs/data_mining_for_intelligence_led_policing.pdf van der Veer, H.T. Roos, A. van der
Zanden.
8. JingGui Lu, Yi Liu, and Xiaoli Li. 2011. The decision tree application in agricultural development. In Proceedings of the Third international conference on
Artificial intelligence and computational intelligence.
9. W. Hu and N. Kaabouch, Big data management, technologies, and applications. Hershey: Information Science Reference an imprint of IGI Global, 2014, pp. 1-
28.
10. J. Gantz and D. Ransel, "Extracting Value from Chaos", Emc.com, 2011. [Online]. Available: https://www.emc.com/collateral/analyst-reports/idc-extracting-
value-from-chaos-ar.pdf. [Accessed: 10- Feb- 2018].
11. IBM. Big data portfolio of products. http://www01.ibm.com/software/data/bigdata/platform/product.html. 2017