Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BD Business 1.1 - Introducción A Big Data
BD Business 1.1 - Introducción A Big Data
BUSINESS
1.INTRODUCCIÓN
& NEGOCIO
1.1. Introducción a
Big Data
Conecta
Empleo
Contenido desarrollado por
Synergic Partners
PROGRAMA
DATOS
ANALÍTICA
TECNOLOGÍA
TECNOLOGÍA Distribuido
Sistemas Distribuidos
son efectivos, pero no
Ante esas limitaciones surgen los Sistemas Distribuidos:
siempre eficientes…
● Un conjunto unificado de máquinas
● Permite procesar grandes cantidades de datos
● Limitación de velocidad porque la programación era muy costosa
Sistema
Distribuido
● Fallo de una máquina podría generar pérdida de información
TECNOLOGÍA Distribuido
S S
Sistema M
Distribuido
Sistema S S
Big Data
Para corregir esas limitaciones existentes surgen los Sistemas Big Data:
TIPOS DE DATOS
en la analítica tradicional
Datos Tendencias
operacionales de mercado
Información
demográfica del cliente
TIPOS DE DATOS
Datos • Datos con un formato de dato establecido
y estructura.
Datos Estructurados • Ejemplo: Datos transaccionales.
operacionales
Datos • Datos de texto con un patrón reconocible, el
cual es apto para ser parseado (troceado).
demográfica del
• Datos de texto con un patrón de datos difícil de
cliente Datos identificar. Pueden ser formateados con
esfuerzo, tiempo y herramientas específicas.
Quasi-Estructurados • Ejemplo: Registros de eventos o acciones en
una web, logs.
Tendencias
• Datos que no tienen ninguna coherencia ni
de mercado Datos No patrón y usualmente están almacenados
en distintos tipos de archivos
Estructurados • Ejemplo: Archivos de texto, PDFs,
Imágenes, Videos..
TRADICIONALMENTE
ACTUALIDAD
Datos No Estructurados
BBDD SQL
Relacional
Las bases de datos SQL o relacionales se caracterizan
por estar formadas por tablas.
Cada una de las tablas contiene una o varias columnas del mismo o
distintos tipos que permiten almacenar la información en filas.
Cada una de las tablas se puede relacionar con ninguna o con varias
tablas para formar el modelo relacional que soporta de manera lógica la
realidad del negocio.
ANALÍTICA TRADICIONAL
(BUSINESS INTELLIGENCE)
Permite conseguir los objetivos empresariales a nivel productos/servicios a partir de un análisis de datos.
Operaciones Analítica
DWH
DATOS
● Alto riesgo en posible fallo de las máquinas:
● Falta de capacidad para almacenar todos los
el fallo de una máquina puede generar una
datos
pérdida de la información en caso de que no se
gestione correctamente. ● Infra-explotación de los datos disponibles
(debido a las limitaciones en términos de
● Almacenamiento centralizado de los datos:
procesamiento y tiempo).
único punto de acceso.
ANALÍTICA
●
la información
Análisis por áreas, no globales.
Conclusión:
● Analítica de hechos pasados, no predictivo. Con el BI no basta…
Volumen Velocidad
Crecimiento a gran escala de los Nuevas necesidades, nuevos
datos... tiempos de respuesta….
Variedad Veracidad
Nuevos orígenes de información, Confianza y certeza en los datos y
nuevos formatos…. las decisiones…..
Valor
Contenido desarrollado por Synergic Partners
1.1 INTRODUCCIÓN AL BIG DATA
Las V’s del Big Data y la Ciencia del Dato
2009 0,8 Zb
2010 1 Zb
2011 1,8 Zb
2018 estimado 35 Zb
2025 estimado 163 Zb
Volumen
¿A qué se debe este
Crecimiento a gran escala de
crecimiento?
los datos...
Volumen
¿A qué se debe este
Crecimiento a gran escala de
crecimiento?
los datos...
Volumen
¿A qué se debe este
Crecimiento a gran escala de
crecimiento?
los datos...
90%
90%
Contenido desarrollado por Synergic Partners
1.1 INTRODUCCIÓN AL BIG DATA
Las V’s del Big Data y la Ciencia del Dato
Volumen
¿Cómo damos respuesta a este
Crecimiento a gran escala de
crecimiento?
los datos...
Volumen
Data Warehouse
Crecimiento a gran escala de
vs
los datos... Data Lake
Variedad
¿Los tipos de datos que
Nuevos orígenes de debemos tratar ha cambiado?
información, nuevos
formatos….
Velocidad
¿Seguimos consumiendo la
Nuevas necesidades, nuevos información de la misma
tiempos de respuesta….
manera ?
Los datos se generan muy rápido y necesitan ser procesados a una gran velocidad
Velocidad
Veracidad
¿Podemos confiar en los
Confianza y certeza en los datos?
datos y las decisiones…..
Autenticidad Disponibilidad
Origen y Responsabilidad
Confianza
reputación
Valor
Real Time
Mejor conectividad De estrategias
permite que reactivas a predictivas
aplicaciones basadas
en Real Time sean Business Intelligence ha
posibles. sido capaz de analizar qué
ha pasado, mientras que la
analítica avanzada nos
permite predecir que va a
pasar.
Datafication
La digitalización genera Democratización
enormes cantidades de datos.
Del control de los datos al
Procesar tal cantidad de datos
Open Data. El acceso a la
era posible con los sistemas
información es mucho
distribuidos, pero no era
más sencillo que antes.
accesible para todo el mundo.
Big Data:
Aporta nuevas herramientas para trabajar
que permiten otras escalas de volumen,
velocidad y flexibilidad para adaptarse a las
nuevas tecnologías de datos. Se enfoca en
hacer predicciones, modelos, previsiones
etc. para un futuro a partir del análisis del
pasado.
Resumen:
BUSINESS INTELLIGENCE BIG DATA
Actitudinal: Interacción:
¿POR QUÉ? ¿CÓMO?
Contenido desarrollado por Synergic Partners
1.1 INTRODUCCIÓN AL BIG DATA
Ejemplo
TODOS !!
• La cerveza era el producto que más aumentaba
sus ventas
• La venta de pop-tarts se multiplica por 7
VS
TECNOLOGÍA LEGISLACIÓN
● Nombre ● Nº Tlf
● Dirección ● Información médica
● DNI ● Nº Cuenta bancaria
● Religión ● IP
● Afiliación sindical ● Estado Civil
● Partido político ● Imagen
¡ ANONIMIZACIÓN !
Contenido desarrollado por Synergic Partners
1.1 INTRODUCCIÓN AL BIG DATA
Aspectos legales y éticos a tener en cuenta
LOPD RGPD
1. Protege a ciudadanos españoles 1. Protege a ciudadanos europeos
LOPD RGPD
1. Derecho de información en la recogida 1. Derecho a la información en la recogida
de datos de forma expresa, precisa e de datos además de forma concisa,
inequívoca transparente, inteligible y de fácil acceso,
con un lenguaje claro y sencillo
OBLIGACIONES Y PROCESOS
LOPD RGPD
1. Se pueden recopilar todos los datos 1. Minimización de datos. Los datos
que el usuario “permita” personales les serán pertinentes y limitados
a lo necesario en relación con los fines para
los que son tratados
2. Pueden almacenarse y tratar los datos a
perpetuidad
2. Tratamiento de los datos durante no más
tiempo del necesario para los fines del
3. No es obligatorio evaluar el riesgo de tratamiento de los datos personales
seguridad de los datos y su sensibilidad
3. Es obligatorio hacer un análisis del
riesgo y sensibilidad
OBLIGACIONES Y PROCESOS
LOPD RGPD
SANCIONES
LOPD RGPD
Entre 900€ y Hasta 20 MM de €
600.000€ o
4% de la facturación
global anual
Los datos de carácter personal objeto de tratamiento no podrán usarse para finalidades
incompatibles con aquellas para las que los datos hubieran sido recogidos.
Los datos de carácter personal sólo se podrán recoger para su tratamiento, así como
someterlos a dicho tratamiento, cuando sean adecuados, pertinentes y no excesivos.
El Derecho al Olvido
Fuente: Abanlex
El Derecho al Olvido
Debate:
COMETÍ UN DELITO EN EL PASADO Y
QUIERO REHACER MI VIDA
DILEMA MORAL
Data Science ofrece una visión holística de la explotación de los datos; es decir, además de
construir modelos analíticos a partir de un conjunto de datos y explicar la relación que existen
entre las variables del modelo, se ocupa de todas las etapas dentro del ciclo de vida del dato.
Esto es, la recolección, limpieza, y transformación de los datos, construcción de modelos
analíticos, y la interpretación de los resultados y presentación de las conclusiones obtenidas en
un formato comprensible y adecuado para su divulgación a otras áreas del negocio.
Participación en el foro