Documentos de Académico
Documentos de Profesional
Documentos de Cultura
análisis de datos
para la toma de
decisiones
Volumen
Variedad
Veracidad
Esta propiedad tiene relación directa con el principio de certidumbre
o certeza de los datos y es sumamente valiosa en verticales de
negocio tales como el sector bancario. Es una propiedad vinculada
al proceso de entrada de datos y por ende está muy relacionada
con la aplicación de la ciencia de datos.
Atributos de Big Data
Valor
En contraste con la veracidad, que es una propiedad de entrada, el
valor es una característica de salida o resultado propia de la
aplicación de un proceso de negocio. La aplicación de big data
sobre los datos del problema nos permite obtener un mayor valor
estratégico y de negocio
Evolución de Big Data
Data Lake
• Un data lake es un repositorio de almacenamiento que
contienen una gran cantidad y tipo de datos en bruto y que se
mantienen allí hasta que sea necesario. A diferencia de un data
warehouse jerárquico que almacena datos en ficheros o
carpetas, un data lake utiliza una arquitectura plana para
almacenar los datos.
• A cada elemento de un data lake se le asigna un identificador
único y se etiqueta con un conjunto de etiquetas de metadatos
extendidas. Cuando se presenta una cuestión de negocios que
debe ser resuelta, podemos solicitarle al data lake los datos
que estén relacionados con esa cuestión. Una vez obtenidos
podemos analizar ese conjunto de datos más pequeño para
ayudar a obtener una respuesta.
Algunos Conceptos
Small Data
• El Small Data es un conjunto de datos con un formato y un
volumen que los hace accesibles, informativos y procesables.
• El objetivo del Small Data es hacer entendible el Big Data,
conectando, organizando y empaquetando los datos para que
estén disponibles para todos los miembros de la organización,
siendo fáciles de aplicar en su día a día, y se centren en la
tarea en cuestión que se desea abordar.
• La diferencia entre el Big Data y el Small Data está en que el
primero atiende a las 5 V´s; mientras que el Small Data se
compone de porciones utilizables.
Algunos Conceptos
Mantenimiento predictivo
Los grandes datos pueden ayudar a predecir fallas en los equipos.
Los posibles problemas se pueden descubrir analizando ambos datos estructurados (año,
marca y modelo del equipo) y datos multiestructurados (entradas de registro, sensores de
datos, mensajes de error, temperatura del motor y otros factores). Con estos datos, los
fabricantes pueden maximizar el tiempo de actividad de las piezas y los equipos e
implementar el mantenimiento de manera más rentable. Estos datos se pueden usar para
predecir más que solo una falla del equipo. Para muchas manufacturas procesos, también es
importante predecir la vida útil restante óptima de los sistemas y componentes para
asegurarse de que funcionan dentro de las especificaciones. Caer fuera de la tolerancia,
incluso si nada está roto, puede ser tan malo como el fracaso. Por ejemplo: en la fabricación
de medicamentos, un dispositivo defectuoso, pero aún funcional podría introducir demasiado
o muy poco del ingrediente activo.
Desafíos
Las empresas deben integrar datos provenientes de diferentes formatos e identificar las
señales que conducir a la optimización del mantenimiento.
Casos de uso
Manufactura
Eficiencia operacional
La eficiencia operativa es una de las áreas en las que el big data puede tener mayor impacto
en rentabilidad. Con big data, puede analizar y evaluar los procesos de producción, responder
de manera proactiva a los comentarios de los clientes y anticiparse a las demandas futuras.
Desafíos
Los equipos de datos deben equilibrar el volumen de datos con el creciente número de
fuentes, usuarios, y aplicaciones.
Casos de uso
Manufactura
Optimización de la producción
La optimización de las líneas de producción puede reducir los costos y aumentar los ingresos.
Los grandes datos pueden ayudar a los fabricantes a entender el flujo de artículos a través de
sus líneas de producción y identificar en qué áreas se puede beneficiar. El análisis de datos
revelará qué pasos conducen a un mayor tiempo de producción y cuáles áreas están
causando retrasos.
Desafíos
La optimización de la producción requiere que los fabricantes analicen los datos de sus
equipos de producción, uso de materiales y otros factores. La combinación de los diferentes
tipos de datos puede suponer un desafío.
Casos de uso
Retail
Desarrollo de productos
Big data puede ayudar a anticipar la demanda de los clientes. Al clasificar los atributos clave
del pasado y productos actuales y luego modelando la relación entre esos atributos y el
comercial éxito de las ofertas, puede crear modelos predictivos para nuevos productos y
servicios. Excavar más profundo mediante el uso de datos y análisis de grupos focales, redes
sociales, mercados de prueba y primeros lanzamientos de tiendas para planificar, producir y
lanzar nuevos productos.
Desafíos
Las empresas tendrán que analizar lo que puede ser un gran volumen de datos en diferentes
formatos, y luego cree segmentos de acuerdo con el comportamiento del cliente. También
tendrán que identificar sofisticados use patrones y comportamientos y mapéelos a nuevas
ofertas potenciales.
Casos de uso
Retail
Desafíos
La integración de un gran volumen de datos de varias fuentes puede ser difícil. Una vez que
los datos son integrados, el análisis de ruta se puede utilizar para identificar rutas de
experiencia y correlacionarlas con varios conjuntos de comportamiento.
Casos de uso
Servicios Financieros
Fraude y cumplimiento
Cuando se trata de seguridad, no se trata solo de unos pocos piratas informáticos
deshonestos. La industria de servicios financieros es contra equipos completos de expertos.
Si bien los panoramas de seguridad y los requisitos de cumplimiento son Constantemente
evolucionando. Mediante el uso de big data, las empresas pueden identificar patrones que
indican fraude y agregar grandes volúmenes de información para agilizar los informes
regulatorios.
Desafíos
Estos datos requieren la integración de diferentes conjuntos de datos de transacciones con
información adicional, tales como eventos de interacción y comportamiento del cliente. Para
identificar posibles patrones de fraude, las empresas tendrá que tamizar a través de un gran
volumen de datos.
Ejercicio en Clase
Busque en internet un caso de éxito de big data y colóquelo en la
siguiente estructura:
1) Situación Inicial
2) Desafío
3) Despliegue
4) Resultados
Responda:
1) Identifique los atributos de Big data en el caso planteado
2) Herramientas utilizadas
3) ¿Cual podría ser una siguiente ola o sprint?
Business Intelligence