Está en la página 1de 99

Analítica de datos, BI y Big Data

I. Introducción y objetivos

II. Características de los datos

III. Gestión de datos

IV. Procesos de extracción, transformación y carga (ETL)

V. Analítica de datos

VI. Analítica e investigación cientí ca

VII. Inteligencia de negocio, Business Intelligence (BI)

VIII. Explotación de datos por parte del usuario nal

IX. Big Data


X. Resumen

XI. Caso práctico con solución

XII. Contenidos recomendados

XIII. Glosario

XIV. Bibliografía
Lección 1 de 14

I. Introducción y objetivos

1.1. Introducción de la unidad


1

Eric Schmidt, antiguo director ejecutivo de Google, asegura que cada dos días generamos tantos
datos como los que la humanidad entera ha producido hasta el año 2003. De ahí que el interés
por aprovechar los datos para analizarlos, aunque no sea nuevo, se haya incrementado; ya que,
en el camino hacia la empresa digital, la información tiene un valor incalculable. Así pues, uno de
los principales activos de las organizaciones es la capacidad de aprovechar las enormes
cantidades de datos generados, principalmente, por personas en las redes sociales; pero también
los generados por las máquinas por medio de comunicaciones M2M y en millones de dispositivos
y sensores conectados a la red por medio del internet de las cosas (IoT). En definitiva, las cifras
sobre el continuo movimiento de datos e información de todo tipo que recorren la red diariamente
no ofrecen dudas sobre la importancia que estos están adquiriendo.
2

El crecimiento de los datos disponibles en la empresa está cambiando la forma de tomar


decisiones por parte de los directivos y da lugar a uno de los componentes fundamentales de la
cultura digital, que se puede resumir en que la toma de decisiones, en todos los ámbitos, se debe
basar en datos. Por ello, el conocimiento de todo el proceso necesario para la recolección, la
gestión, los modelos de análisis de datos, las distintas aplicaciones que puede tener la analítica y
las herramientas disponibles se ha convertido actualmente en una competencia clave de los
directivos.
3

Los datos adquieren valor cuando pueden utilizarse para realizar la analítica y las consultas
necesarias para tomar decisiones corporativas o en los departamentos. Los datos, en muchos
casos, están almacenados con gran detalle y recogen cada una de las transacciones que se
realizan de acuerdo con las necesidades específicas de los procesos de negocio que abarcan.
Asimismo, una parte de los datos, en su origen, están organizados en ficheros de texto o bases de
datos que es preciso transformar para lograr que el proceso de análisis sea óptimo.
4

En la toma de decisiones relevantes o estratégicas, el exceso de detalle de los datos se convierte


en ruido o distorsión. Para obtener una agregación de los datos necesarios, estos necesitan
gestionarse e integrarse para garantizar su acceso a disposición de cualquier parte de la
organización que lo precise. Los métodos más habituales de gestión de datos se inician con los
procesos ETL (extraer, transformar y cargar) o con la incorporación de estos a un lago de datos.
5

A partir de estos procesos, los datos quedan disponibles para incorporarse a las herramientas,
tanto de hardware como de software, y llevar a cabo la analítica más adecuada, según la utilidad
que se le quiera dar a la información por parte de los diferentes usuarios en la empresa.
6

En esta unidad de analítica de datos, BI y big data se estudian, de forma conjunta, los distintos
tipos de fuentes de datos disponibles en toda la empresa, se analizan los procesos de gestión
necesarios para ponerlos a disposición de los diferentes usuarios para que, con las aplicaciones
de la arquitectura, las herramientas y los métodos de análisis adecuados, como la inteligencia de
negocio, analítica web y de redes sociales o big data, puedan disponer de las visualizaciones e
informes necesarios para la toma de decisiones.

C O NT I NU A R

1.2. Objetivos de la unidad


Al finalizar el estudio de esta unidad, el estudiante habrá alcanzado los siguientes objetivos:

1 Saber clasificar los datos en función de las fuentes (externas e internas) y los tipos
(estructurados y desestructurados).

2 Conocer las aplicaciones del Data Management para obtener información valiosa al almacenar
y gestionar, de una forma integral, los datos útiles de la empresa.

3 Conocer cómo se desarrollan los procesos y las herramientas que se utilizan en la extracción,
transformación y carga (ETL) de los datos para su integración en almacenes de datos.

4 Identificar los componentes de la arquitectura y los procesos necesarios para transformar los
datos en información.

5 Conocer los modelos de análisis de datos: descriptivo, predictivo y prescriptivo.

6 Conocer cómo realizan la explotación de datos los usuarios finales de la inteligencia de


negocio (BI), qué métodos se utilizan y qué tipos de informes se pueden obtener.

7 Entender el significado de inteligencia de negocio e identificar el conjunto de metodologías,


aplicaciones y tecnologías que se utilizan en BI.

8 Identificar las técnicas de big data para procesar grandes cantidades de datos, estructurados
o desestructurados, de forma mucho más rápida y eficiente.
Lección 2 de 14

II. Características de los datos

Los datos están disponibles para las grandes No se necesitan todos, sino tener claro cuáles
empresas, pero también las pymes pueden sacar necesitamos y de cuáles podemos disponer y
provecho de ellos sin grandes presupuestos. No analizar a un coste razonable. Este enfoque
obstante, hay que desistir de usarlos todos e permite abordar proyectos dirigidos de forma
identificar cuáles son estratégicos y aportan valor al práctica y que puedan reportar beneficios de
desarrollo de objetivos prioritarios. inmediato y sin grandes riesgos.

Figura 1. Información y toma de decisiones.


Fuente: elaboración propia.
C O NT I NU A R

2.1. Datos, información, conocimiento

Un dato es una representación simbólica (numérica, alfabética, El diccionario de la Real Academia


algorítmica, etc.) de un atributo o variable cuantitativa o cualitativa. Española recoge el significado de
Los datos son la mínima unidad, elementos primarios de dato: “información dispuesta de
información que, por sí solos, son irrelevantes y no suelen decir manera adecuada para su tratamiento
nada sobre el porqué de las cosas. Un dato es un número de por una computadora”. Así, el dato
teléfono, un apellido, una hora o la coordenada de un lugar. Los puro no sirve si no está preparado
datos pueden estar en la mente de una persona, en papel o en un adecuadamente para presentarse
soporte digital. mediante software.

Los datos son la expresión de hechos


objetivos expresados en términos
alfanuméricos.

En las empresas se utilizan, a menudo, para reflejar diversas


transacciones, qué materias primas hemos comprado para fabricar
productos, qué productos y cuántas unidades se han fabricado, qué
clientes han comprado cada producto y a qué precio los hemos
vendido. Los datos describen parte de lo que pasa en la realidad y no
permiten juicios de valor o interpretaciones.
C O NT I NU A R

2.2. La información

El término “información” se relaciona con “dar forma” a datos. La mayoría de los autores lo definen como
mensaje, generalmente en forma de documento o comunicación audible o visible. Su propósito es
cambiar el criterio del receptor, influir en su punto de vista o conducta. Los datos se convierten en
información cuando quien los procesa agrega significado y propósito, añade valor para convertirlos en
información útil en su trabajo o en la toma de decisiones.

La información siempre es subjetiva, ya que la descripción de un hecho es subjetiva. Esta característica


no es negativa ni invalida su función en la creación de conocimiento, pues en las distintas formas de
interpretarla se generan procesos de innovación en la gestión, en los productos o en la forma de
relacionarse con los clientes. La información, por otro lado, se puede entender como un conjunto de
datos procesados con significado por su relevancia, propósito y contexto. La información es
comunicación de conocimiento o inteligencia, capaz de cambiar la forma en que el receptor percibe algo,
sus juicios de valor y sus comportamientos.

Davenport define conocimiento como combinación de experiencia valor información “saber hacer” que
Davenport define conocimiento como combinación de experiencia, valor, información, saber hacer que
sirve de marco para importar nuevas experiencias e información, además de ser útil para la acción. Se
origina y aplica en la mente de los individuos. En la organización, no solo está en documentos o
almacenes de datos, sino que también está implícito en procesos prácticos y normas.

C O NT I NU A R

2.3. Conversión de los datos en información


Tabla 1. Métodos para convertir datos en información.
Fuente: elaboración propia.

C O NT I NU A R

2.4. Generación de datos


La digitalización de todas las actividades, el alto grado de Estas tecnologías han conseguido que la
movilidad alcanzado, basado en las tecnologías de la información generada se multiplique de
comunicación y la implantación casi universal de la banda forma espectacular. Los últimos informes
ancha, el despliegue de las innumerables redes de sensores así lo ratifican: cada minuto se generan 4,1
que componen el internet de las cosas y tecnologías como el millones de búsquedas en Google, se
cloud computing, que permite almacenar y gestionar, de escriben 347 000 tuits, se comparten 3,3
forma remota, grandes cantidades de datos, han modificado millones de mensajes instantáneos y se
de forma radical el lugar de la información en nuestra vida y descargan 194 000 apps (Fundación
nuestra forma de trabajar. Telefónica, 2016).

Según la consultora McKinsey, el 90 % de los datos se han generado


en los últimos dos años y la progresión de aumento es difícil de
calcular.
Figura 2. Origen de los datos.
Fuente: elaboración propia.

C O NT I NU A R

2.5. Naturaleza de los datos

La naturaleza de los datos es diferente y proceden de fuentes


distintas, como sensores, redes sociales, interrelaciones entre
entidades, conversaciones, bases de datos, artículos, fotografías o
vídeos. Para IBM, existe gran variedad de tipos de datos que deben
analizarse, que clasifican en distintas categorías, según su
procedencia y los asuntos que queramos resolver.

Tabla 2. Naturaleza de los datos.


Fuente: elaboración propia.

C O NT I NU A R

2.6. Datos estructurados y no estructurados


¿De dónde provienen tantos datos? De muchas fuentes: desde
sensores meteorológicos, medios sociales, fotografías y vídeos
digitales hasta transacciones de compra. Wolfran (2002) distingue
tres categorías:

Tabla 3. Tipos de datos.


Fuente: Wolfram, 2002.

El BBVA los clasifica en función de dos fuentes de datos (externas e


internas) y de dos tipos de datos (estructurados y
desestructurados). Según la fuente de procedencia y el tipo, los
datos se pueden definir a partir del cuadrante en el que se integren:
Figura 3. Clasificación de los datos.
Fuente: BBVA, 2013.

Esta diferente tipología y el ritmo de crecimiento en su generación


han desbordado los programas informáticos tradicionales. Son
necesarios nuevos tipos de programas y herramientas capaces de
procesar, estructurar y analizar esta información. Pasamos así, por
ejemplo, de las hojas de Excel y las bases de datos a Hadoop, una
aplicación de software libre que permite trabajar con miles de nodos
distribuidos y con petabytes de información (un petabyte equivale a
1015 bytes =
1 000 000 000 000 000 bytes).

Contenidos recomendados

En este documental de RTVE, se explica cómo la digitalización del mundo físico y los algoritmos se han
situado en el centro de nuestro estilo de vida. La novedad ya no es que cada persona lleve uno o dos
dispositivos conectados, sino que ahora los objetos también se conectan entre sí.

RTVE. Big data, conviviendo con el algoritmo. Documentos TV. Vídeos Bos, YouTube, 4 de agosto de
2017. [En línea] URL disponible en el siguiente enlace.

También puede verse en la página web de RTVE, “A la carta”, Documentos TV.


Lección 3 de 14

III. Gestión de datos

En la actualidad, la gestión de datos tiene una No obstante, la gran cantidad de datos


importancia vital para determinar el futuro de las disponibles, las distintas fuentes de
organizaciones, que deben hacer el máximo esfuerzo por procedencia y la gran variedad de formatos que
recoger todos los datos a su alcance y analizarlos para presentan dificultan, en gran medida, la tarea
obtener información útil para la empresa. de aprovechar toda su potencialidad.

C O NT I NU A R

3.1. Gestión de la información

La gestión de la información es una actividad compleja que está


dividida en varias fases o capas:
Tabla 4. Capas de datos para la gestión de la información.
Fuente: elaboración propia.

En cada una de estas capas de datos, se tendrá toda la


infraestructura necesaria para:

Extraer los datos



De todas las fuentes que tengamos disponibles en nuestra capa de aplicaciones de negocio, en todos los
formatos posibles, bien sean estructurados o no estructurados.

Limpieza de los datos



Filtrado, tratamiento y limpieza para obtener un conjunto de datos plenamente analizable. Esta es una de
las fases más importantes, ya que, si los datos de partida no son correctos, todos los análisis serán
erróneos.

Análisis

En esta fase se analizan los datos, donde se buscan patrones de comportamiento que nos permitan
mejorar los estándares de trabajo y optimizar los resultados de negocio.

Ejecución o descubrimiento

En la que se utilizan los análisis que se han obtenido para retroalimentar los algoritmos de análisis y seguir
alimentando y mejorar así la capacidad del sistema de análisis. Además, es en esta fase donde enviamos
los datos al motor de BI para obtener los reportes.

C O NT I NU A R
3.2. Las funciones de la gestión de datos

Para ofrecer una respuesta a sus necesidades, las Un proyecto dirigido a la gestión integral de los
empresas deben disponer de soluciones de gestión de datos implica una serie de características que
datos que les faciliten la integración de la información garanticen acceso a los datos desde cualquier
con el resto de los sistemas de la empresa. En este fuente disponible, la integración de esos datos
sentido, el data management permite a las empresas en el resto de los sistemas y la entrega de la
obtener información valiosa mediante el almacenamiento información resultante a cualquier parte de la
y la gestión, de una forma integral, de todos los datos que organización que lo precise, prácticamente en
tienen relación con ellas. tiempo real.

Data Management International (DAMA), una asociación independiente


de proveedores que analiza el ámbito de la gestión de datos, señala
once funciones esenciales en una correcta gestión de datos que dé
respuesta a las necesidades del negocio.
Tabla 5. Funciones de la gestión de datos.
Fuente: Power Data, 2013.

C O NT I NU A R

3.3. La integridad de los datos

El concepto de integridad de los datos hace referencia a Es importante, por lo tanto, garantizar la
la cualidad de los datos que les confiere carácter de integridad de los datos y disponer de las
información fiable, homogénea, coherente y exacta. Este herramientas necesarias para detectar y
concepto adquiere una gran relevancia para todo tipo de corregir las posibles anomalías con la mayor
organizaciones, de cualquier sector, dada la importancia rapidez posible, especialmente cuando se trata
que la información y el conocimiento tienen en la de datos críticos o confidenciales de la
economía digital y globalizada en la que vivimos, ya que organización o se manejan datos de carácter
la fiabilidad de esos datos determinará el grado de personal. La necesidad de potenciar la
acierto en la toma de decisiones estratégicas y, con ello, seguridad aumenta, asimismo, en el momento
la supervivencia de la organización. en que la información sale de los límites de la
empresa.

Cualquier incidencia en la seguridad e integridad de los datos puede


afectar muy seriamente a la imagen de la organización y, con ello, a
sus resultados de negocio, por no mencionar las posibles
consecuencias legales que podría acarrear.

 La integridad de los datos puede verse afectada por distintas causas, como el hecho
de trabajar con datos no estructurados (por ejemplo, los datos de una hoja de
cálculo), lo que implica una determinada falta de control sobre los datos; por
redundancia, o duplicación de datos; por fallos o errores en el sistema; al introducir
datos de forma manual, actividad muy abierta al error humano; o por ataques
deliberados a su integridad.
Por ello, una correcta gestión de los datos debe proveerse de las
herramientas necesarias para garantizar la seguridad y la integridad
de estos, para protegerlos de incidencias fortuitas y actuaciones no
deseadas que pongan en riesgo su utilidad.

Tabla 6. Mecanismos de seguridad e integridad de datos.


Fuente: elaboración propia.
Lección 4 de 14

IV. Procesos de extracción, transformación y carga


(ETL)

4.1. Procesos de ETL

Una vez que se han identificado los datos disponibles en Los procesos de ETL son necesarios porque,
las distintas fuentes de la empresa, los procesos extract, en los sistemas de origen, los datos están
transform, load (ETL), que equivaldrían en español a almacenados con gran detalle, según las
extraer, transformar y cargar, suponen una herramienta necesidades específicas de los procesos de
muy valiosa en los procesos de integración de datos entre negocio que abarcan. Sin embargo, las
distintos sistemas o aplicaciones. Los procesos de ETL consultas necesarias para tomar decisiones
permiten que la empresa pueda obtener y relacionar datos corporativas no precisan información tan
de distintas fuentes, ordenarlos, reformatearlos, detallada, sino un resumen agregado de esta.
prepararlos, cargarlos en otro sistema y utilizarlos en sus A la vez, una parte de los datos de origen que
procesos de negocio. Permite, también, realizar estas se van a utilizar en la inteligencia de negocio
operaciones con datos alojados en aplicaciones están organizados en ficheros de texto o
heredadas que aún se mantienen en la empresa y que es bases de datos que es preciso transformar
preciso integrar con las nuevas aplicaciones. para lograr que el proceso de análisis sea
óptimo.
Tabla 7. Procesos de ETL.
Fuente: elaboración propia.

 Mediante estos procesos, las empresas pueden disponer de una serie de datos
procedentes de fuentes muy variadas que, de otro modo, sería enormemente
laborioso conseguir, integrar sistemas con distintas fuentes de datos y obtener
información valiosa para un desarrollo más eficiente de los procesos de negocio.
Una vez tratada y procesada, la empresa puede disponer de esa valiosa información
para optimizar todos sus procesos de negocio.

C O NT I NU A R

4.2. Procesos en el almacén de datos


Un almacén de datos es un contenedor en el que se almacenan los
datos procedentes de las distintas fuentes que puedan existir en
una organización, donde quedan integrados, depurados y ordenados
en una única base de datos centralizada. En este almacén se
guardarán los datos hasta que estén listos para ser analizados
mediante las herramientas de explotación. Los datos se almacenan
en:

Una vez llevado a cabo el


proceso de ETL, y con los
datos ya integrados,
Almacén de datos o data depurados y ordenados, se
warehouse envían a una única base de
datos centralizada o
contenedor único, que se
denomina almacén de

A su vez, en ocasiones y en
función de las necesidades
de la empresa, también se
Mercados de datos o data pueden hacer otras cargas
mart
mart
de interés para un área
específica o departamento
del negocio. En realidad,
ñ ti ió

Son bases de datos


multidimensionales
compuestas por
dimensiones y métricas
Cubos OLAP
que permiten tener
información previamente
agregada, con todas las
combinaciones posibles de

C O NT I NU A R

4.3. Modelado de datos

Una de las decisiones más importantes en los procesos de


almacenamiento de datos es la técnica de modelado de los datos,
utilizada habitualmente en los mercados de datos.
 El modelado de datos dimensional facilita la comprensión de la base de datos por
parte de los usuarios de negocio no expertos y se utiliza con frecuencia en los
almacenes de datos y los mercados de datos por su alto rendimiento en las búsquedas
y su representación de los datos analíticos.

Se basa en dos conceptos claves: hechos y dimensiones.

LO S HE C HO S O T H LA S DI M E N S I O N E S O T D

Son las métricas, normalmente valores numéricos que pueden ser agregados.

LO S HE C HO S O T H LA S DI M E N S I O N E S O T D

Son los valores cualitativos, que describen los hechos o les aportan un contexto.
Se utilizan dos técnicas de modelado dimensional: el esquema de
estrella, más sencillo, y el esquema de copo de nieve, más complejo
al utilizar en alguna dimensión más que una tabla de datos.

Figura 4. Modelo de esquema de datos en estrella.


Fuente: Bigeek.

C O NT I NU A R
4.4. Herramientas ETL y datos en tiempo real

Las herramientas actuales usadas por la gran Las empresas de menor tamaño pueden recurrir a
empresa para los procesos ETL son Powercenter de productos de código abierto ETL, que pueden
Informática, Datastage de IBM, Oracle Data emplearse de forma gratuita. Estas herramientas
Integrator o SAS Data Integrator. El alto coste de tienen niveles muy diferentes de integración y
estas aplicaciones hace que se utilicen solo en facilidades de uso en el diseño y ejecución de
grandes empresas. procesos.

Tabla 8. Herramientas ETL de código abierto.


Fuente: elaboración propia.

 La transformación digital, el aumento de disponibilidad de datos en tiempo real y el big


data pueden hacer cambiar el futuro de la ETL tradicional, ya que estas herramientas
anteriores tienen limitaciones en tiempo real y puede que traigan el fin de los procesos
ETL. Por el momento, ya han surgido soluciones híbridas como SAP HANA, Hadoop y
otras que permiten que se mantengan los procesos de ETL tradicional y las tecnologías
big data.
C O NT I NU A R

4.5. Los lagos de datos

Se puede definir “lago de datos” (data lake) como un depósito de


fácil acceso donde se almacenan y procesan una gran cantidad de
datos (big data) en su formato nativo, sin ningún tipo de
transformación o tratamiento previos, para ponerlos a disposición
del usuario cuando sean requeridos, a través de una arquitectura
plana. Permite una entrega de datos mucho más rápida, inteligente
y clara. Los datos se vuelcan en el lago y cada usuario puede
visualizarlos según sus necesidades específicas, con la tecnología
más adecuada para esa tarea. Las principales características de los
lagos de datos se pueden ver en la tabla 9.
1

Tabla 9. Características del lago de datos.

Fuente: BBVA.
2

Tabla 10. Diferencia entre data warehouse y lago de datos.

Fuente: Logicalis.
3

Tabla 11. Ventajas e inconvenientes del lago de datos.

Fuente: Logicalis.
Lección 5 de 14

V. Analítica de datos

La ciencia de los datos en el entorno empresarial incluye el conocimiento y los procesos relacionados
con el descubrimiento de datos, su modelado, el análisis y la predicción del comportamiento, así como
el desarrollo de aplicaciones y su conversión en información o conocimiento útil para las decisiones de
la empresa: “Así como Internet es un factor de desintermediación que está afectando a muchas
cadenas de valor, el análisis de información en grandes volúmenes, de diversas fuentes, a gran
velocidad y con una flexibilidad sin precedentes puede suponer un factor diferencial para aquellos que
decidan adoptarlo” (BBVA, 2013).

Es necesario dar valor a la ingente cantidad de datos de los que disponemos para explotar todas las
posibilidades que nos ofrecen, que podemos integrar y analizar de forma inteligente para alcanzar un
mejor conocimiento de la información que contienen y obtener, así, mayores beneficios, tanto
económicos como sociales.
Por ejemplo, un sistema en el que el uso de redes de distribución eléctrica y contadores inteligentes se
integre con las redes de generación, sistemas de información geográfica, bases de datos, información
de clientes y otros sistemas centrales posibilitaría una mejor gestión y mayor eficiencia en el uso de la
energía, lo que permitiría también detectar de forma más rápida, e incluso prevenir, posibles averías y
fallos en el sistema o fraudes en el consumo.

C O NT I NU A R

5.1. Análisis de datos

Las empresas y las organizaciones que sepan hacer las preguntas


adecuadas (en el momento preciso) incrementarán su ventaja
competitiva. Desde el punto de vista de los negocios, actualmente se
parte del data science (ciencia de datos) hacia el data intelligence
(inteligencia de datos) (BBVA, 2013).

 La creciente capacidad de la tecnología para predecir posibles comportamientos, a


partir del análisis de datos del entorno, ofrece un enorme potencial para el desarrollo de
las empresas, que pueden aprovechar las grandes cantidades de datos producidos por
sus máquinas (M2M), por sus relaciones con clientes y proveedores o por otros muchos
medios. Hoy en día, es posible utilizar estas capacidades para predecir los
comportamientos de los clientes y adelantarse a sus necesidades, para modificar así los
procesos de manera más rápida y flexible.

C O NT I NU A R

5.2. Fases del análisis de datos

En la analítica de datos intervienen cuatro fases: recopilación y


almacenamiento, limpieza y procesamiento, estructuración y
análisis y modelado.
Tabla 12. Fases de la analítica de datos.
Fuente: elaboración propia.

C O NT I NU A R

5.3. Análisis de datos no estructurados


Los datos no estructurados pueden transformarse en datos
estructurados con diversos métodos. A continuación, se presentan
los métodos más habituales:

Tabla 13. Tipos de análisis de datos.


Fuente: elaboración propia.

C O NT I NU A R

5.4. Uso de los datos en la empresa


El uso de datos está creciendo en las empresas españolas. El 62 % de
ellas utilizan ya análisis de datos para su negocio. La posibilidad de
disponer de un proceso de toma de decisiones rápido y fiable, basado
en la información disponible, tiene un valor incalculable en el futuro del
negocio.

El uso de esta tecnología supone un potencial enorme para las


empresas, que tienen la posibilidad de recopilar, procesar y analizar,
en tiempo real, grandes cantidades de datos y utilizarlos para
adquirir ventajas competitivas sobre la competencia. La posibilidad
de generar valor a partir de estos datos está transformando de
forma radical la forma en que las organizaciones gestionan sus
negocios. Su uso es extrapolable a cualquier sector de actividad,
desde la medicina hasta la energía, los recursos humanos, la
industria 4.0, la agricultura, la educación, la banca o los seguros.
Tabla 14. Usos del análisis de datos.
Fuente: elaboración propia.

C O NT I NU A R
5.5. La visión 360° del cliente a partir de la analítica de
datos

El desarrollo de la visión 360° de cada cliente es el La analítica web y de redes sociales, el


fundamento del marketing y el servicio al consumidor. Esto desplazamiento del marketing y la publicidad
ayuda a agilizar el proceso de compra, al facilitar la de las empresas hacia las webs
búsqueda en un catálogo con muchas referencias de un corporativas, el buscador de Google y las
mismo producto. El seguimiento de los clientes que redes sociales, como Facebook, han hecho
navegan en la web suministra información valiosa para necesaria la analítica para conocer y mejorar
construir y perfeccionar el motor de recomendación. los resultados y los costes de esta.
Lección 6 de 14

VI. Analítica e investigación científica

6.1. Datos relevantes para la empresa

En el ámbito empresarial, hay una gran cantidad de Pero el verdadero valor no es la cantidad de
datos, pero solo una parte son útiles y aportan valor en datos y variables que se pueden medir, sino su
cuanto a la mejora de las actividades de la empresa. interpretación, que permite anticiparse a los
Aun después de limpiar los datos irrelevantes, queda un sucesos más relevantes para la empresa. El
gran volumen de datos de los que, en la actualidad, no análisis de la información también puede evitar
se saca provecho alguno. Una vez determinado qué pérdidas al permitir planificar personal, materias
datos son relevantes, su analítica puede ofrecer primas o maquinaria y evitar así la disminución
información de gran utilidad. de la producción.

C O NT I NU A R

6.2. Ciclo de investigación científica

Los métodos de investigación científica definen, de forma similar, los

pasos de la analítica de datos. A la vez, los experimentos permiten


examinar el papel de otros factores relacionados que pueden ser
relevantes.
Los resultados de la analítica, para ser La analítica de datos, en la primera etapa, se puede realizar al
fiables, deben tener en cuenta el análisis analizar situaciones con pocas variables, técnicas
empírico que supone identificar la estadísticas elementales y los datos disponibles. En este
correlación entre variables y la causalidad caso, los resultados de los estudios deben presentarse como
entre ellas. provisionales.

Tabla 15. Ciclo de la investigación científica.


Fuente: elaboración propia.

C O NT I NU A R
6.3. Modelos de análisis de datos de negocio

Los modelos de análisis de datos más habituales usados en los


negocios, en función de los objetivos específicos que se pretendan
alcanzar, son tres: descriptivo, predictivo y prescriptivo.

Tabla 16. Modelos de análisis de datos.


Fuente: elaboración propia.

C O NT I NU A R
6.4. Analítica predictiva

Hoy en día, la empresa genera con su actividad enormes El manejo de tanta información requiere nuevos
cantidades de datos que puede analizar y procesar para modelos capaces de ir más allá de la simple
desarrollar algoritmos o patrones de comportamiento información descriptiva, que aprenden de
que ayuden a tomar decisiones o predecir resultados en situaciones anteriores y predicen futuros
posteriores situaciones similares, como en el caso de comportamientos y colaboran de forma
retenciones de tráfico o el diagnóstico médico. decisiva en la toma de decisiones en función
de estos.

Tabla 17. Analítica predictiva.


Fuente: elaboración propia.

C O NT I NU A R
6.5. Modelos predictivos

Muchos autores hablan, así, del paso de big data al smart data. Para la
Fundación Telefónica, el enfoque smart data permitirá no solo realizar
predicciones, sino recomendaciones más fiables, por lo que se recurre
a él cada vez con más frecuencia en los departamentos comerciales
para mejorar su eficiencia (Fundación Telefónica, 2016).

La analítica predictiva se puede utilizar para hacer predicciones Las técnicas procedentes de la minería
acerca del futuro de las personas en las organizaciones. Para de datos han sido siempre útiles en las
ello, el análisis predictivo utiliza la estadística junto con organizaciones empresariales, pero,
algoritmos de minería de datos; así, se analizan datos actuales gracias al big data, han sido capaces de
e históricos con el fin de hacer predicciones sobre el futuro. No procesar mayores cantidades de datos,
obstante, es preciso señalar que estas predicciones no suelen sean estructurados o desestructurados,
ser absolutas, sino que más bien se trata de establecer de forma mucho más rápida (incluso en
porcentajes de probabilidad sobre sucesos futuros. tiempo real) y eficiente.

Los modelos predictivos más usados,


por orden de menor a mayor dificultad
en su utilización, son los que aparecen
en la tabla 18.
Tabla 18. Modelos predictivos más usados.
Fuente: elaboración propia.
Lección 7 de 14

VII. Inteligencia de negocio, Business Intelligence


(BI)

7.1. Arquitectura y procesos de BI

La inteligencia de negocio se asocia directamente a las tecnologías


de la información. Se puede entender como la unión de las
metodologías, tecnologías y aplicaciones que permiten reunir,
depurar y transformar datos de los sistemas transaccionales de
información desestructurada (interna y externa a la compañía) en
información estructurada para su explotación directa.

En la figura 5, se muestra una arquitectura de inteligencia de negocio y


los procesos para la obtención de informes.
Figura 5. Arquitectura y procesos de inteligencia de negocios.
Fuente: Bigeek.

C O NT I NU A R

7.2. Definición de inteligencia de negocio (BI)

El término “inteligencia de negocio” o business intelligence (BI) hace


referencia al uso de estrategias y herramientas que sirven para
transformar datos en información y esta en conocimiento, con el
objetivo de mejorar el proceso de toma de decisiones en una empresa.
Se puede definir inteligencia de negocio como el conjunto de
metodologías, aplicaciones y tecnologías que permiten reunir, depurar
y transformar datos de los sistemas transaccionales e información
desestructurada en información estructurada para su explotación
directa o para su análisis y conversión en conocimiento de soporte a
la toma de decisiones sobre el negocio.

Las principales características de la inteligencia de negocio actual


son:

A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S

Permite la analítica de datos de gestión para la toma de decisiones casi en tiempo real.

A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S

Accesibilidad a la información: supone un punto de acceso centralizado a datos completos y estructurados.


A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S

Apoyo en la toma de decisiones: maneja información relevante para la consecución de los objetivos del
negocio.

A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S

Orientación al usuario final: proporciona un acceso rápido y sencillo a la información sintetizada.

Una de las claves de esta herramienta de negocios es la facilidad


con la que accede a los datos operacionales y los sintetiza para
convertirlos en información estratégica. Esta información supondrá
la base fundamental para conocer el entorno externo y analizar el
interno de la empresa, con el fin de tomar decisiones mejores y más
rápidas, encaminadas a la consecución de los objetivos.
Tabla 19. Uso de BI en el análisis de actividades de la empresa.
Fuente: elaboración propia.

C O NT I NU A R

7.3. Información para el negocio


La inteligencia de negocio no funciona solo a partir de Para ello, dispone de herramientas para generar
un proceso tecnológico, sino que necesita la informes y alertas y entregarlos en formato de
concurrencia de procesos de recopilación e tableros de visualización de gráficos, mapas o
integración de datos de las actividades relevantes, indicadores, entre otros, que permitan obtener
obtenidos en un flujo continuo, de la competencia de información valiosa y actualizada convertida en
las personas y de la tecnología necesaria, orientados conocimiento con respecto a la situación del
a la obtención de información de alto valor para la negocio, y que suponen un soporte efectivo al
toma de las decisiones que determinan la estrategia y proceso de toma de decisiones sobre el negocio
la competitividad del negocio. por parte de los directivos.

La información de la inteligencia de negocio debe responder a los


problemas de negocio, tanto estratégicos como operativos: entrada
a nuevos mercados, promociones u ofertas de productos,
eliminación de islas de información, control financiero, optimización
de costes, planificación de la producción, análisis de perfiles de
clientes o rentabilidad de un producto concreto.
Figura 6. De un sistema de información a BI.
Fuente: Bigeek.

 La inteligencia de negocio se construye sobre una plataforma tecnológica que permite


desarrollar varios sistemas que disponen de infraestructura y herramientas conectadas a
las fuentes de datos operativos sobre ventas y marketing desde el CRM, de movimiento
de provisiones o productos a lo largo de la cadena de suministro almacenados en el
SCM, de finanzas desde el ERP, o de aplicaciones de tecnologías como inteligencia
artificial, machine learning , big data o IoT, entre otras.
Lección 8 de 14

VIII. Explotación de datos por parte del usuario


final

Hasta aquí se ha estudiado cómo se desarrollan los son los más importantes para la empresa, ya
procesos relacionados con la puesta en marcha de un que van a obtener el resultado del desarrollo
sistema de inteligencia de negocio, que incluyen la previo. Es aquí donde se van a transformar
localización de las fuentes de información y los procesos los datos en información y donde se crea el
ETL. A continuación, se estudia la explotación de datos que conocimiento necesario para la toma de
lleva a cabo el usuario final. Estos procesos decisiones en la empresa.

C O NT I NU A R

8.1. Herramientas de usuario para la obtención de


información

Las herramientas de usuario son las que se utilizan para hacer las
consultas y obtener la información que los diferentes usuarios
necesitan para la toma de decisiones. En la figura 7, en la parte
derecha, se pueden ver estas herramientas de explotación de datos
de negocio, que utiliza el personal encargado del sistema o
directamente el usuario de la información; en definitiva, el personal
de gestión o la dirección de la empresa, que la necesitan para la
toma de decisiones.

Figura 7. Desarrollo de una solución BI.


Fuente: Ibermática.

Las herramientas disponibles para los usuarios dirigidas a obtener


información de gestión, al tratarse de aplicaciones incluidas en los
sistemas de BI comerciales, suelen estar bastante normalizadas y
tienen menos complejidad. Se trata, básicamente, de las de consultas
(query o reporting), los indicadores del cuadro de mando (KPI) o los
análisis de cuadros OLAP.

C O NT I NU A R

8.2. Consultas o reporting

En un sistema de inteligencia de negocio, en función de Para obtener la información, las herramientas


si los informes que se quieren obtener son para utilizarlos de consulta se conectan a los repositorios de
en la gestión o se trata de obtener información para el datos diseñados en los procesos de
soporte o la toma de decisiones de la dirección, hay almacenamiento, que pueden ser los
diferentes herramientas de consulta o reporting, tal como almacenes de datos o los mercados de datos,
se puede ver en la figura 7. establecidos en los procesos de ETL.

La visualización de datos es una de las herramientas más utilizadas


entre los usuarios, por su capacidad de visualizar la información con
diferentes grados de agregación o con diferentes jerarquías, en
función de los filtros que se introduzcan.

A la hora de diseñar los informes, se debe tener en cuenta:


TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME

Que se puedan llevar a cabo mediante consultas sencillas y de forma eficiente, para obtener la información
con rapidez.

C A R A C TER Í STI C A TA
C O N S ULTA S LI M I TA R INFORME
S

Que sean uniformes, con lo que hay que tener en cuenta la definición de los colores, las fuentes o los filtros
que se van a utilizar para dar una apariencia homogénea.

TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME

Limitar el número de elementos del informe para que la visualización sea sencilla y que el mantenimiento y
actualización sean dinámicos.

TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME
El informe debe comprenderse de forma intuitiva y ágil, sin necesidad de aprendizaje por parte del
destinatario.

TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME

Que la visualización se pueda realizar en un único tablero de mando o pestaña, para evitar así la navegación.

C O NT I NU A R

8.3. Cuadro de mando integral e indicadores clave de


negocio

Las empresas que implantan inteligencia de negocio han recorrido diversas fases anteriores, como la de
implantación de cuadros de mando integrales (CMI), sistemas de soporte a la decisión (DSS) o sistemas de
información ejecutiva (EIS). En todos los casos, las organizaciones han de haber predeterminado con
claridad tanto las métricas como los indicadores clave de negocio (KPI, por sus siglas en inglés), que son
las herramientas de medición que utilizarán para controlar sus actuaciones y realizar un seguimiento
permanente de los resultados, para medir su progreso y determinar si se están alcanzando los objetivos
marcados y, en su caso, corregir las acciones o sustituirlas por otras nuevas.
Los KPI son indicadores cuantificables que ofrecen información detallada (cifras, gráficos, bases de datos,
etc.) sobre alguno de los aspectos críticos que inciden en el rendimiento del negocio. La cuantificación de
estos datos permite realizar un análisis detallado y contrastarlo con los objetivos buscados.

 Los indicadores no son estándar, pueden variar entre empresas de un mismo sector o
bien que empresas de distinta índole los compartan. Cada empresa tiene la capacidad
de implantar únicamente los indicadores adecuados a lo que quiere medir. Por ello, la
inteligencia de negocio debe programar cómo recoger la información necesaria y
aplicar los procesos adecuados para que proporcionen, de manera sencilla y de forma
periódica, los indicadores de negocio.

El análisis OLAP se utiliza cuando se realizan análisis de escenarios


complejos con algoritmos estadísticos, que usan bases de datos
multidimensionales que deben haber sido incorporadas en la
arquitectura de almacenamiento de datos.

C O NT I NU A R

8.4. Minería de datos (data mining)


La minería de datos es un proceso de análisis que trata de buscar
patrones de comportamiento que no son fácilmente identificables a
simple vista. Para ello, se hace necesaria la aplicación de complejos
procesos estadísticos para identificar correlaciones, patrones de
comportamiento, grupos de afinidad o predicción de datos. Los
modelos más comunes que se aplican en la minería de datos son:

Ddetermina la probabilidad de
que un individuo pertenezca a
Clasificación un grupo en función del valor
que tengan otras variables
independientes.

Es una técnica dentro de la


disciplina de inteligencia
artificial que identifica, de
forma automática,
Agrupaciones en clúster
agrupaciones o clústeres de
elementos de acuerdo con
una medida de similitud entre
ellos.
Predice el valor que tendrá
una variable numérica en
Regresión función del valor que tengan
otras variables
independientes.

Predice el valor que tendrá


una variable numérica, en
un momento del tiempo, en
función del valor que esa
Pronóstico
misma variable tenía en
diferentes momentos del
pasado y del valor que
tenían otras variables
La minería de datos es la analítica más compleja de BI y la más
directamente aplicable a los sistemas de información ejecutiva
(EIS), los sistemas de soporte a las decisiones (DSS) o los cuadros
de mando integral (BSC).

C O NT I NU A R

8.5. So ware de BI

Las herramientas que vamos a comentar a continuación hacen


referencia a la parte de usuario o de reporting:
Tabla 20. Herramientas de BI.
Fuente: elaboración propia.
Contenidos recomendados

Power BI, herramienta de análisis y visualización de datos

En esta página web de Power BI, se pueden ver las utilidades de esta herramienta de BI. Además, se puede
descargar de forma gratuita durante 60 días para conocer su funcionamiento (accesible a través de este
enlace).
Lección 9 de 14

IX. Big Data

9.1. Definiciones de big data

Tascón define big data, de forma breve, como el También expone que “el tratamiento y gestión de
conocimiento empíricamente obtenido de los datos y enormes cantidades de datos procedentes de
los hechos puestos a nuestra disposición para tomar múltiples fuentes, como las redes sociales
decisiones. El big data está emparentado con lo que (Facebook o Twitter, por ejemplo) y las tecnologías
se ha conocido como minería de datos, un campo de de las comunicaciones, son de vital importancia en
las ciencias de la computación que intenta descubrir el contexto de la inteligencia competitiva, lo que ha
patrones en grandes volúmenes de datos. La minería fomentado el auge de tecnologías y servicios de big
de datos, al igual que el big data, utiliza los métodos data. Además, los servicios de inteligencia y
de la inteligencia artificial y la estadística para seguridad centran su interés en el proceso de estos
analizar los patrones en las bases de datos con las datos y en el desarrollo de tecnologías que
que trabaja (Tascón, 2013). permitan su transformación en conocimiento”.

El Diccionario LID de inteligencia y seguridad lo define como


“anglicismo que hace referencia al conjunto de datos cuyo tamaño
excede la capacidad de los programas informáticos utilizados
habitualmente para capturar, gestionar y procesar información” (LID
Editorial, 2013).
Para la Fundación Bankinter, “big data es el conjunto de tecnologías, técnicas y herramientas que hacen
posible la recogida, procesamiento y análisis de volúmenes masivos de datos, y también la visualización
de los resultados. El propósito es convertir la información hallada en esos grandes conjuntos de datos en
algo útil como estadísticas, patrones de comportamiento, análisis de rendimiento, etc.” (Fundación
Bankinter, 2015).

Una de las definiciones más comunes de big data explica esta área como el conjunto de procesos,
tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios
datos encierran.

Asimismo, según Telefónica: “Se dice que revolucionará la salud, como acelerador del conocimiento y la
decisión clínica, y ayudará a crear tratamientos realmente eficaces y eficientes. Es la piedra angular de
las smart cities, clave en la transformación hacia la banca digital y en una nueva agricultura de precisión.
Ha dado vida al periodismo de datos, ha cambiado la forma de ver el deporte, se ha convertido en una
necesidad crítica para los negocios por la ventaja competitiva que representa…” (Telefónica, 2016).

Por tanto, el big data permite recopilar, gestionar y analizar grandes cantidades de datos procedentes de
las interacciones personales o de la multitud de dispositivos conectados del internet de las cosas, para
convertirlos en información valiosa, frente a la incapacidad de los sistemas tradicionales para procesar
tales cantidades. Saber cómo analizar estos datos en tiempo real y cómo actuar a partir de la
información resultante supone una ventaja competitiva para las organizaciones, ya que les permite una
respuesta automatizada, más rápida y flexible ante las demandas cambiantes del mercado. En un
mercado globalizado como el actual, las empresas no pueden prescindir de esta información, ni siquiera
permitirse que esta llegue con retraso.

C O NT I NU A R

9.2. Datos de internet de las cosas, M2M y cloud

Varios conceptos muy relacionados La digitalización de muchas actividades es un hecho y se observa


con el big data son el internet de las un nuevo impulso de la mano de innovaciones que pueden tener un
cosas y las comunicaciones M2M, efecto importante. Es el caso de la proliferación de sensores que
que aportan millones de sensores recogen continuamente datos de lo que sucede en un entorno
distribuidos por el mundo para fabril. Mediante técnicas de big data, se podrían analizar gran
recoger y enviar información cantidad de estos datos en tiempo real, lo que podría añadir 2,2
continuamente, así como el cloud, billones de euros al PIB europeo en 2030 gracias al uso de datos
capital para conectar estos datos con para detectar patrones, disminuir tiempos muertos y aumentar la
las soluciones big data. eficiencia:

El análisis de paquetes masivos de datos tendrá cada vez mayor


adopción, y abre interrogantes cara a los usuarios y su privacidad, o
las empresas y la fiabilidad o potencialidad real de los resultados
obtenidos. No hay área ni sector que no esté afectado por las
implicaciones de este concepto, que modifican estrategias de análisis,
cambian herramientas y patrones de medida y también la
presentación, por medio de la visualización, la cuarta “V” que
posibilita una nueva forma de ver los datos de manera comprensible.
(Lombardero, 2015)

C O NT I NU A R

9.3. Big data en la empresa

Según Accenture, en su informe Gran éxito con big data, las


organizaciones que usan big data están “extremadamente satisfechas
con los resultados”. Asimismo, cuanto mayor es la compañía, mejores
son los resultados (Accenture, 2014).

En las encuestas realizadas para este informe, se Un 89 % de los encuestados señala que el big data
señala que el big data supone una ventaja revolucionará las operaciones de negocios, tal como
competitiva por su poder disruptivo en todos los lo hizo en su día internet. El 79 % opina que aquellas
sectores, desde servicios financieros y seguros empresas que no adopten el big data perderán
hasta servicios postales y administraciones competitividad y corren el riesgo de desaparecer.
públicas.
En cuanto al área en la que el big data tendrá más impacto en los
próximos años, los directivos encuestados señalan principalmente, y
por este orden:

Tabla 21. Áreas de mayor impacto del big data.


Fuente: Accenture, 2014.

C O NT I NU A R

9.4. Uso de los macrodatos en la empresa

El uso del big data está creciendo en las El uso de esta tecnología supone un potencial enorme para
empresas españolas. El 62 % utiliza ya las empresas, ya que tienen la posibilidad de recopilar,
soluciones de big data para su negocio. procesar y analizar, en tiempo real, grandes cantidades de
Además, el 74 % de los ejecutivos datos y utilizarlos para adquirir ventajas competitivas sobre
encuestados por Accenture afirma que el la competencia. La posibilidad de generar valor a partir de
big data es esencial para la transformación estos datos está transformando de forma radical la forma
digital de la empresa. La posibilidad de en que las organizaciones gestionan sus negocios. Su uso
disponer de un proceso de toma de es extrapolable a cualquier sector de actividad, desde la
decisiones rápido y fiable, basado en la medicina hasta la energía, los recursos humanos, la
información disponible, tiene un valor industria 4.0, la agricultura, la educación, la banca o los
incalculable en el futuro del negocio. seguros.

Las estrategias basadas en analíticas big data especializadas en las


redes sociales son especialmente útiles para las empresas en su
adopción de estrategias de marketing personalizadas y flexibles.

Tabla 22. Usos del big data en la empresa.


Fuente: centro de innovación del BBVA.
Lección 10 de 14

X. Resumen

Repasa los conocimientos adquiridos en la unidad

En esta unidad se ha estudiado la actual importancia de los datos y los distintos métodos de análisis,
que resumimos a continuación:
Analítica web y de redes sociales

El desplazamiento del marketing y la publicidad de las empresas hacia las webs corporativas, el
buscador de Google y las redes sociales, como Facebook, han hecho necesaria la analítica para conocer
y mejorar los resultados de los costes. Alrededor de este nuevo fenómeno, los mismos buscadores y
redes sociales desarrollaron sus propias herramientas y aplicaciones de medición y analítica de estas
actividades.
El usuario de la analítica es la dirección de marketing y ventas, que utiliza datos de clientes obtenidos de
paneles de clientes, publicidad, tráfico en la web, opiniones en redes sociales, correo electrónico o la
aplicación de gestión de la relación con los clientes (CRM).

Inteligencia de negocio o business intelligence (BI)

Una de las claves de esta herramienta de negocios es la facilidad con la que accede a los datos
operacionales y los sintetiza para convertirlos en información estratégica de la empresa, con el fin de
tomar mejores y más rápidas decisiones encaminadas a la consecución de los objetivos.

El término BI ha ganado en relevancia actualmente por el aumento de los datos que se ha producido por
la digitalización y, a la vez, por el desarrollo de la capacidad de procesamiento y de tratamiento de los
datos.

Big data
Término popularizado hace pocos años, se refiere al análisis de los macrodatos que está en el centro de
la transformación digital. El valor de los macrodatos radica, en realidad, en el análisis que sea capaz de
realizar cada empresa, gobierno o individuo de los datos disponibles. La gran mayoría de las compañías
solo usaban una pequeña parte de los datos estructurados procedentes de las transacciones. La
explosión de datos del tráfico de la web o las redes sociales, las máquinas o los sensores, da lugar a un
largo camino por delante para extraer el valor completo de la información que pueden obtener.

El análisis de big data es la utilización de grandes cantidades de datos producidos con gran rapidez, en
gran medida desestructurados, que los sistemas tradicionales no pueden procesar y almacenar, y que
necesitan nuevas plataformas analíticas para su análisis.

La analítica web y de redes sociales, la inteligencia de negocio (BI) y el big data

Pueden tener destinatarios diferentes en la empresa, están en un estadio de desarrollo diferente, usan
datos provenientes de fuentes diferentes y tecnologías y aplicaciones específicas en cada caso. Sin
embargo, a la vez, la metodología analítica utilizada proviene, en su gran mayoría, de la ciencia de los
datos, y la información obtenida de las diferentes analíticas, una vez resumida e integrada, se utiliza por
parte de la alta dirección de la empresa con el objetivo de mejorar la toma de decisiones. Todo ello hace
lógico pensar en la utilidad de avanzar en una visión integrada de la gestión de los datos, la analítica y las
herramientas de obtención de la información por parte de los distintos usuarios de la empresa, para ser
capaces de satisfacer la creciente necesidad de tomar las decisiones considerando no solo la
información histórica, sino utilizando los resultados de la analítica predictiva.
Lección 11 de 14

XI. Caso práctico con solución

Aplica los conocimientos adquiridos en esta unidad

ENUNCIADO

Thyssenkrupp ha puesto en marcha MAX, “el primer sistema de mantenimiento predictivo, a tiempo real,
en la industria de los ascensores”. Basado en una combinación de tecnologías como internet de las
cosas, big data, cloud y aprendizaje automático, MAX “aumenta la disponibilidad y eficiencia de los
ascensores y reduce el tiempo de averías a través de diagnósticos en tiempo real”. Según Thyssenkrupp,
MAX está revolucionando el servicio de mantenimiento de los ascensores en el mundo.
En la siguiente figura, se recoge el funcionamiento de MAX.

Figura 8. Utilización de los datos en el sistema de mantenimiento MAX.


Fuente: MAX Thyssenkrupp

SE PIDE

Explica cómo Thyssenkrupp utiliza el análisis de datos para mantenimiento predictivo de ascensores, así
como las ventajas del sistema MAX.

VER SOLUCIÓN
SOLUCIÓN

El análisis de datos también es de suma utilidad para predecir el comportamiento de las máquinas y
adelantarse a las posibles averías o problemas de funcionamiento, lo que ahorra tiempo y costes.
Thyssenkrupp ha desarrollado una solución de mantenimiento predictivo para ascensores potenciada
por la tecnología del internet de las cosas de Microsoft Azure, que es capaz de reducir el tiempo de
inactividad del ascensor hasta la mitad, lo que aumenta significativamente la disponibilidad de los
ascensores, especialmente importante en las ciudades con edificios de gran altura.

MAX utiliza diversas tecnologías, entre ellas big data, internet de las cosas (IoT) y las comunicaciones
machine to machine (M2M), con la capacidad de recibir información de diversos sensores distribuidos
en los ascensores y en los recorridos de estos, para recoger y enviar información de forma continua, así
como la tecnología de la nube a través de Azure, para recoger los datos y enviarlos a MAX.

El funcionamiento de MAX se basa en la recogida de información, en tiempo real, y su envío a la nube,


donde la información se analiza para obtener algoritmos que permitan estimar el tiempo de vida de cada
componente del sistema y diagnosticar cuándo se precisa una revisión. Thyssenkrupp presenta MAX
como el primer sistema de mantenimiento predictivo, a tiempo real, en la industria de los ascensores que
permite la utilización de tecnología para reducir el tiempo de inactividad hasta un 50 %.

A la vez, MAX se utiliza como una herramienta de marketing y venta de sus ascensores, que utiliza los
servicios de mantenimiento eficaz del ascensor para reducir los tiempos de paradas por averías como un
potente argumento de venta. Ahora, más que nunca, el tiempo es esencial para los ciudadanos. Al
aumentar la disponibilidad del ascensor, MAX ofrece a los trabajadores y residentes en edificios altos y
rascacielos la última tecnología para ahorrar pérdidas de tiempo debido a las averías. Tener instalado un
ascensor con el sistema de mantenimiento de MAX supone disponer de estadísticas de servicio,
disponibilidad del ascensor o de las escaleras, fecha de la última revisión, etcétera.

Así, Thyssenkrupp relata las ventajas que el cliente obtiene con un ascensor que integra MAX para su
mantenimiento predictivo:
Máxima disponibilidad y fiabilidad del ascensor.

Prolonga la vida útil del ascensor.

Calidad del servicio y satisfacción del cliente.

Eficiencia inteligente para las ciudades.

La captura de datos sirve para ofrecer además un canal exclusivo de comunicación con los clientes de
ofertas especiales, promociones personalizadas, la consulta de la facturación, los presupuestos de
reparación o modernización, la última revisión obligatoria y su fecha de validez.
Lección 12 de 14

XII. Contenidos recomendados

Lecturas

Fundación Innovación Bankinter (2015). Big data. El poder de los datos. [En línea] URL
disponible en este enlace.

Vídeos

Retos y oportunidades en Big data. [En línea] URL disponible en este enlace.

Big Data en Telefónica. [En línea] URL disponible en este enlace.

Big data de las redes sociales para predecir el comportamiento ciudadano. [En línea] URL
disponible en este enlace.
Lección 13 de 14

XIII. Glosario

El glosario contiene términos destacados para la


comprensión de la unidad

Análisis combinado

Tipo de análisis de datos desestructurados que permite utilizar datos de texto, datos de vídeo y datos de
sensores, que da lugar a informaciones más precisas o más ajustadas a los contextos.
Análisis de discurso

Tipo de análisis de datos desestructurados basado en la escucha de audios de conversaciones para
analizar el contenido emocional del habla, con categorías como “enfadado”, “frustrado” o “satisfecho”.

Análisis de texto

Tipo de análisis de datos desestructurados que utiliza el procedimiento de extracción de la información a
partir de grandes cantidades de texto. Permite clasificar textos, extraer conceptos, resumir documentos o
analizar opiniones.

Análisis de vídeo/imágenes

Tipo de análisis de datos desestructurados que utiliza algoritmos que revisan cada escena y plano, y
cataloga la información para identificar patrones de referencias cruzadas que permiten la identificación
facial, el análisis de comportamientos o el conocimiento de la situación.

Análisis predictivo

Eel análisis predictivo utiliza la estadística junto con algoritmos de minería de datos. Se basa en el análisis
de los datos actuales e históricos para hacer predicciones sobre futuros eventos. Estas predicciones no
suelen ser afirmaciones absolutas, sino que se parecen más a eventos y su probabilidad de que sucedan
en el futuro. Se pueden distinguir tres modelos usados en los negocios:

Modelo predictivo: usa datos históricos y actuales para determinar patrones y evaluar las
probabilidades de determinados comportamientos.

Modelo descriptivo: estudia las relaciones entre los datos para establecer clasificaciones en grupos.

Modelo de decisión: analiza todos los elementos que intervienen en la toma de decisiones para
predecir los resultados de cada posible decisión.
Árboles de decisión

Modelo predictivo del análisis de datos que clasifica datos en conjuntos, en función de los datos de
entrada. Estas clasificaciones ayudan a entender el camino de alguien en las decisiones que adopta.

Big data

Tecnología que posibilita la captura, almacenamiento y procesamiento de enormes cantidades de datos,
tanto estructurados como no estructurados, que las tecnologías tradicionales no son capaces de manejar.
La información obtenida se analiza para obtener valor para la empresa y facilitar los procesos de toma de
decisiones.

Big Data Value Association (BDVA)



Asociación sin ánimo de lucro, formada por empresas, centros de investigación, universidades europeas y
otras instituciones especializadas en big data cuyo objetivo es promover el desarrollo estratégico, la
investigación y la innovación en esta área.

Business intelligence (BI)



Conjunto de aplicaciones y herramientas encargadas de analizar los datos empresariales para obtener
información útil y relevante que facilite y optimice la toma de decisiones en las organizaciones. Junto con
técnicas de analítica predictiva, inteligencia artificial y otras tecnologías para el procesamiento de datos, el
BI evoluciona hacia una gestión más precisa y eficiente de volúmenes de información cada vez más
grandes.
Carga de datos

Proceso ETL mediante el cual los datos, ya transformados y con la calidad necesaria para su análisis, se
envían a un almacén de datos o data warehouse.

Científico de datos

Nueva figura que surge del desarrollo de las tecnologías de big data. Se trata de un profesional con
formación lógico-formal y habilidades en matemáticas, estadística e ingeniería informática, a la vez que
domina la lógica de la investigación científica, para extraer el máximo valor de los datos disponibles en
función de las necesidades del negocio.

Cloud computing

Sistema de servicios informáticos que ofrece soporte para almacenamiento, bases de datos,
comunicaciones, monitorización, software y otros servicios a través de cualquier dispositivo conectado a
internet.

Cubos OLAP

Bases de datos multidimensionales compuestas por dimensiones y métricas que permiten tener
información, previamente agregada, con todas las combinaciones posibles de las perspectivas incluidas y,
de esta forma, visualizar las métricas que interesen al usuario, por lo que facilitan la consulta en los
sistemas de inteligencia de negocios. Las dimensiones, a su vez, tienen jerarquías y niveles. Este diseño
permite mayor capacidad de cálculo para poder realizar análisis de escenarios complejos con algoritmos
estadísticos.
Data architecture

Establece el conjunto de especificaciones (los modelos, políticas y reglas) que definen los requisitos
estratégicos de los datos; es decir, describe la estructura, tanto física como lógica, de los datos dentro de la
organización y cómo están interrelacionados.

Data governance

Parte central de la gestión de datos que se encarga de controlar, planificar y supervisar la gestión y uso de
datos en todas las demás áreas.

Data integration & interoperabitity



Define el conjunto de estándares y especificaciones necesarios para asegurar la integración y la
transferencia de los datos en la organización

Data modeling & design



Conjunto de especificaciones empleadas para diseñar, estructurar, organizar e implementar la base de
datos.

Data quality

Define, controla y mejora la calidad de los datos, lo que garantiza que no tengan defectos y que sean
precisos, consistentes y completos.
Data security

Función de la gestión de datos que controla todos los mecanismos y políticas encaminados a garantizar la
privacidad, confidencialidad y acceso apropiados.

Data storage

Función de la gestión de datos que determina cómo, cuánto y qué se almacena.

Data warehousing & BI



Funciones de la gestión de datos que se ocupan de lo referente a datos históricos y analíticos.

Data mart (mercado de datos)



En función de las necesidades de la empresa, se pueden hacer cargas de datos de interés para un área
específica o departamento del negocio. En realidad, son una pequeña partición del almacén principal (data
warehouse), con datos de uso departamental. El mercado de datos está orientado a la consulta, con una
organización de los datos clara y estructurada en modelos dimensionales de estrella o copo de nieve.

Data warehouse (almacén de datos)



Una vez llevado a cabo el proceso de ETL y con los datos ya integrados, depurados y ordenados, se envían a
una única base de datos centralizada o contenedor único, que se denomina almacén de datos o data
warehouse, diseñado con los requisitos necesarios y listos para ser analizados por el usuario final del
sistema BI, que utiliza las herramientas de explotación, visualización o de creación de informes. Los datos
se guardan en el almacén el tiempo necesario y deben ser actualizados según las necesidades de
consulta de cada empresa.

Dato

Información dispuesta de manera adecuada para su tratamiento por un ordenador. Así, no sirve el dato puro
si no está preparado adecuadamente para presentarse mediante software.

Datos estructurados

Datos que son almacenables en filas y columnas. Son el tipo de datos más empleados por los sistemas
de registro y los más sencillos de etiquetar, organizar y procesar.

Datos no estructurados

Se trata del tipo de datos más complejo, aquellos que se presentan en un formato que no puede ser
indexado en tablas relacionales para el análisis; son los datos de imágenes, audio, vídeo o los de las redes
sociales.

Datos semiestructurados

Datos que no se ajustan a un esquema fijo y explícito: documentos XML, los blogs o los sensores emplean
este tipo de datos.
Documents & contents

Función de la gestión de datos que establece las reglas aplicables a los datos fuera de las bases de datos.

Extracción de datos

Proceso ETL para obtener los datos de las fuentes de origen, que se analizan para comprobar que cumplen
con los criterios de estructura, organización y formato fijados.

HR Analytics

Uso estratégico de herramientas y metodologías de análisis aplicadas a macrodatos para tener un mayor
conocimiento de los empleados y colaboradores de la organización.

Información

Mensaje, generalmente en forma de documento o comunicación audible o visible. Su propósito es cambiar
el criterio del receptor, influir en su punto de vista o conducta. Los datos se convierten en información
cuando quien los procesa agrega significado y propósito, añade valor para convertirlos en información útil
en la toma de decisiones.

Integridad de los datos



Cualidad de los datos que les confiere carácter de información fiable, homogénea, coherente y exacta.

Inteligencia de negocio

Conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de
los sistemas transaccionales e información desestructurada en información estructurada para su
explotación directa o para su análisis y conversión en conocimiento de soporte a la toma de decisiones
sobre el negocio.

Internet de las cosas



Tecnología basada en sensores y redes de comunicación que permiten captar y procesar datos del
entorno, que conecta objetos y personas de forma inteligente y en tiempo real y procesa toda la
información que generan para ofrecer respuestas más fiables, rápidas y eficientes.

Lago de datos

Depósito de fácil acceso donde se almacenan y procesan una gran cantidad de datos (big data) en su
formato nativo, sin ningún tipo de transformación o tratamiento previos, para ponerlos a disposición del
usuario cuando se requieran, que utiliza para ello una arquitectura plana. Permite una entrega de datos
mucho más rápida, inteligente y clara. Los datos se vuelcan en el lago y cada usuario puede visualizar los
datos según sus necesidades específicas, con la tecnología más adecuada para esa tarea.

Machine to machine (M2M):



Tecnología que posibilita la comunicación inteligente de datos e información entre máquinas y entre estas
y el sistema a través de conexiones inalámbricas, físicas o híbridas.
Metadata

Trata de proporcionar, integrar y controlar metadatos. El objetivo de esta función es entender el impacto de
cualquier clase de información y reducir la redundancia.

Minería de datos

Proceso de análisis que trata de buscar patrones de comportamiento que no son fácilmente identificables
a simple vista. Para ello, se hace necesaria la aplicación de complejos procesos estadísticos para
identificar correlaciones, patrones de comportamiento, grupos de afinidad o predicción de datos.

Modelo descriptivo del análisis de datos



Utiliza datos históricos y actuales, en tiempo real, para determinar patrones y evaluar las probabilidades de
determinados comportamientos. Por ejemplo, evaluar el comportamiento de los clientes y adelantar las
probabilidades de que muestren un comportamiento específico en el futuro

Modelo predictivo del análisis de datos



Estudia las relaciones entre los datos para clasificarlos en grupos. Mientras el modelo predictivo se centra
en predecir el comportamiento de un individuo, el modelo descriptivo identifica diferentes relaciones entre
clientes y productos. Por ejemplo, para clasificar las preferencias de los clientes en función de su edad o
sexo.
Modelo prescriptivo o de decisión del análisis de datos

Analiza las relaciones entre todos los elementos que intervienen en la toma de decisiones (los datos, las
posibles decisiones y las variables que determinan la decisión) para predecir los resultados de cada una de
las decisiones posibles. En algunos casos utiliza reglas de negocio para automatizar la toma de
decisiones.

Proceso ETL

Herramienta que posibilita la integración de datos entre distintos sistemas o aplicaciones. Los procesos
ETL permiten que la empresa pueda obtener y relacionar datos de distintas fuentes, ordenarlos,
reformatearlos, prepararlos, cargarlos en otro sistema y utilizarlos en sus procesos de negocio. Permiten,
también, realizar estas operaciones con datos alojados en aplicaciones heredadas que aún se mantienen
en la empresa y que es preciso integrar con las nuevas aplicaciones.

Redes neuronales

Modelo predictivo del análisis de datos que utiliza técnicas capaces de modelar relaciones muy complejas,
a la vez que tienen la capacidad de manejar relaciones no lineales entre los datos. Se utilizan a menudo
para confirmar los hallazgos de técnicas más simples. Se basan en reconocimiento de patrones y algunos
procesos de inteligencia artificial.

Reference & master data



Aporta una visión 360° de la información y garantiza que los datos más importantes para el negocio se
creen con la consistencia y calidad necesarias.
Regresión lineal o logística

Modelo predictivo del análisis de datos que estima las relaciones entre variables para encontrar patrones
claves entre grandes cantidades de datos continuos para predecir los valores de nuevos datos.

Transformación de datos

Proceso ETL por el que se transforman los datos extraídos para ajustarlos a los criterios y restricciones del
sistema de destino y para poder realizar los cálculos precisos en su explotación.
Lección 14 de 14

XIV. Bibliografía

Accenture (2014). Gran éxito con Big data.

BBVA (2013). Big Data. Es hora de generar valor de negocio con los datos.

Fundación Innovación Bankinter (2015). El poder de los datos. Madrid: Fundación Innovación
Bankinter.

Fundación Telefónica (2016). La sociedad de la información en España 2015. Madrid:


Fundación Telefónica.

Lombardero, L. (2015). Trabajar en la era digital. Madrid: LID Editorial Empresarial.

Marr, B. (2017). Big data en la práctica. Zaragoza: Teell Editorial.

Power Data (2013). Data Management. La gestión de datos eficaz. [En línea] URL disponible en
este enlace.

Tascón, M. (2013). Introducción: Big Data. Pasado, presente y futuro. Telos: Cuadernos de
comunicación e innovación, 95:47-50.

Telefónica (2016). Big Data: el poder de convertir datos en decisiones.

VV. AA. (2013). Diccionario LID de inteligencia y seguridad. Madrid: LID Editorial Empresarial.

Wolfram, S. (2002). A new kind of science. Champaign (IL): Wolfram Media, Inc.

También podría gustarte