Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I. Introducción y objetivos
V. Analítica de datos
XIII. Glosario
XIV. Bibliografía
Lección 1 de 14
I. Introducción y objetivos
Eric Schmidt, antiguo director ejecutivo de Google, asegura que cada dos días generamos tantos
datos como los que la humanidad entera ha producido hasta el año 2003. De ahí que el interés
por aprovechar los datos para analizarlos, aunque no sea nuevo, se haya incrementado; ya que,
en el camino hacia la empresa digital, la información tiene un valor incalculable. Así pues, uno de
los principales activos de las organizaciones es la capacidad de aprovechar las enormes
cantidades de datos generados, principalmente, por personas en las redes sociales; pero también
los generados por las máquinas por medio de comunicaciones M2M y en millones de dispositivos
y sensores conectados a la red por medio del internet de las cosas (IoT). En definitiva, las cifras
sobre el continuo movimiento de datos e información de todo tipo que recorren la red diariamente
no ofrecen dudas sobre la importancia que estos están adquiriendo.
2
Los datos adquieren valor cuando pueden utilizarse para realizar la analítica y las consultas
necesarias para tomar decisiones corporativas o en los departamentos. Los datos, en muchos
casos, están almacenados con gran detalle y recogen cada una de las transacciones que se
realizan de acuerdo con las necesidades específicas de los procesos de negocio que abarcan.
Asimismo, una parte de los datos, en su origen, están organizados en ficheros de texto o bases de
datos que es preciso transformar para lograr que el proceso de análisis sea óptimo.
4
A partir de estos procesos, los datos quedan disponibles para incorporarse a las herramientas,
tanto de hardware como de software, y llevar a cabo la analítica más adecuada, según la utilidad
que se le quiera dar a la información por parte de los diferentes usuarios en la empresa.
6
En esta unidad de analítica de datos, BI y big data se estudian, de forma conjunta, los distintos
tipos de fuentes de datos disponibles en toda la empresa, se analizan los procesos de gestión
necesarios para ponerlos a disposición de los diferentes usuarios para que, con las aplicaciones
de la arquitectura, las herramientas y los métodos de análisis adecuados, como la inteligencia de
negocio, analítica web y de redes sociales o big data, puedan disponer de las visualizaciones e
informes necesarios para la toma de decisiones.
C O NT I NU A R
1 Saber clasificar los datos en función de las fuentes (externas e internas) y los tipos
(estructurados y desestructurados).
2 Conocer las aplicaciones del Data Management para obtener información valiosa al almacenar
y gestionar, de una forma integral, los datos útiles de la empresa.
3 Conocer cómo se desarrollan los procesos y las herramientas que se utilizan en la extracción,
transformación y carga (ETL) de los datos para su integración en almacenes de datos.
4 Identificar los componentes de la arquitectura y los procesos necesarios para transformar los
datos en información.
8 Identificar las técnicas de big data para procesar grandes cantidades de datos, estructurados
o desestructurados, de forma mucho más rápida y eficiente.
Lección 2 de 14
Los datos están disponibles para las grandes No se necesitan todos, sino tener claro cuáles
empresas, pero también las pymes pueden sacar necesitamos y de cuáles podemos disponer y
provecho de ellos sin grandes presupuestos. No analizar a un coste razonable. Este enfoque
obstante, hay que desistir de usarlos todos e permite abordar proyectos dirigidos de forma
identificar cuáles son estratégicos y aportan valor al práctica y que puedan reportar beneficios de
desarrollo de objetivos prioritarios. inmediato y sin grandes riesgos.
2.2. La información
El término “información” se relaciona con “dar forma” a datos. La mayoría de los autores lo definen como
mensaje, generalmente en forma de documento o comunicación audible o visible. Su propósito es
cambiar el criterio del receptor, influir en su punto de vista o conducta. Los datos se convierten en
información cuando quien los procesa agrega significado y propósito, añade valor para convertirlos en
información útil en su trabajo o en la toma de decisiones.
Davenport define conocimiento como combinación de experiencia valor información “saber hacer” que
Davenport define conocimiento como combinación de experiencia, valor, información, saber hacer que
sirve de marco para importar nuevas experiencias e información, además de ser útil para la acción. Se
origina y aplica en la mente de los individuos. En la organización, no solo está en documentos o
almacenes de datos, sino que también está implícito en procesos prácticos y normas.
C O NT I NU A R
C O NT I NU A R
C O NT I NU A R
C O NT I NU A R
Contenidos recomendados
En este documental de RTVE, se explica cómo la digitalización del mundo físico y los algoritmos se han
situado en el centro de nuestro estilo de vida. La novedad ya no es que cada persona lleve uno o dos
dispositivos conectados, sino que ahora los objetos también se conectan entre sí.
RTVE. Big data, conviviendo con el algoritmo. Documentos TV. Vídeos Bos, YouTube, 4 de agosto de
2017. [En línea] URL disponible en el siguiente enlace.
C O NT I NU A R
Análisis
–
En esta fase se analizan los datos, donde se buscan patrones de comportamiento que nos permitan
mejorar los estándares de trabajo y optimizar los resultados de negocio.
Ejecución o descubrimiento
–
En la que se utilizan los análisis que se han obtenido para retroalimentar los algoritmos de análisis y seguir
alimentando y mejorar así la capacidad del sistema de análisis. Además, es en esta fase donde enviamos
los datos al motor de BI para obtener los reportes.
C O NT I NU A R
3.2. Las funciones de la gestión de datos
Para ofrecer una respuesta a sus necesidades, las Un proyecto dirigido a la gestión integral de los
empresas deben disponer de soluciones de gestión de datos implica una serie de características que
datos que les faciliten la integración de la información garanticen acceso a los datos desde cualquier
con el resto de los sistemas de la empresa. En este fuente disponible, la integración de esos datos
sentido, el data management permite a las empresas en el resto de los sistemas y la entrega de la
obtener información valiosa mediante el almacenamiento información resultante a cualquier parte de la
y la gestión, de una forma integral, de todos los datos que organización que lo precise, prácticamente en
tienen relación con ellas. tiempo real.
C O NT I NU A R
El concepto de integridad de los datos hace referencia a Es importante, por lo tanto, garantizar la
la cualidad de los datos que les confiere carácter de integridad de los datos y disponer de las
información fiable, homogénea, coherente y exacta. Este herramientas necesarias para detectar y
concepto adquiere una gran relevancia para todo tipo de corregir las posibles anomalías con la mayor
organizaciones, de cualquier sector, dada la importancia rapidez posible, especialmente cuando se trata
que la información y el conocimiento tienen en la de datos críticos o confidenciales de la
economía digital y globalizada en la que vivimos, ya que organización o se manejan datos de carácter
la fiabilidad de esos datos determinará el grado de personal. La necesidad de potenciar la
acierto en la toma de decisiones estratégicas y, con ello, seguridad aumenta, asimismo, en el momento
la supervivencia de la organización. en que la información sale de los límites de la
empresa.
La integridad de los datos puede verse afectada por distintas causas, como el hecho
de trabajar con datos no estructurados (por ejemplo, los datos de una hoja de
cálculo), lo que implica una determinada falta de control sobre los datos; por
redundancia, o duplicación de datos; por fallos o errores en el sistema; al introducir
datos de forma manual, actividad muy abierta al error humano; o por ataques
deliberados a su integridad.
Por ello, una correcta gestión de los datos debe proveerse de las
herramientas necesarias para garantizar la seguridad y la integridad
de estos, para protegerlos de incidencias fortuitas y actuaciones no
deseadas que pongan en riesgo su utilidad.
Una vez que se han identificado los datos disponibles en Los procesos de ETL son necesarios porque,
las distintas fuentes de la empresa, los procesos extract, en los sistemas de origen, los datos están
transform, load (ETL), que equivaldrían en español a almacenados con gran detalle, según las
extraer, transformar y cargar, suponen una herramienta necesidades específicas de los procesos de
muy valiosa en los procesos de integración de datos entre negocio que abarcan. Sin embargo, las
distintos sistemas o aplicaciones. Los procesos de ETL consultas necesarias para tomar decisiones
permiten que la empresa pueda obtener y relacionar datos corporativas no precisan información tan
de distintas fuentes, ordenarlos, reformatearlos, detallada, sino un resumen agregado de esta.
prepararlos, cargarlos en otro sistema y utilizarlos en sus A la vez, una parte de los datos de origen que
procesos de negocio. Permite, también, realizar estas se van a utilizar en la inteligencia de negocio
operaciones con datos alojados en aplicaciones están organizados en ficheros de texto o
heredadas que aún se mantienen en la empresa y que es bases de datos que es preciso transformar
preciso integrar con las nuevas aplicaciones. para lograr que el proceso de análisis sea
óptimo.
Tabla 7. Procesos de ETL.
Fuente: elaboración propia.
Mediante estos procesos, las empresas pueden disponer de una serie de datos
procedentes de fuentes muy variadas que, de otro modo, sería enormemente
laborioso conseguir, integrar sistemas con distintas fuentes de datos y obtener
información valiosa para un desarrollo más eficiente de los procesos de negocio.
Una vez tratada y procesada, la empresa puede disponer de esa valiosa información
para optimizar todos sus procesos de negocio.
C O NT I NU A R
A su vez, en ocasiones y en
función de las necesidades
de la empresa, también se
Mercados de datos o data pueden hacer otras cargas
mart
mart
de interés para un área
específica o departamento
del negocio. En realidad,
ñ ti ió
C O NT I NU A R
LO S HE C HO S O T H LA S DI M E N S I O N E S O T D
Son las métricas, normalmente valores numéricos que pueden ser agregados.
LO S HE C HO S O T H LA S DI M E N S I O N E S O T D
Son los valores cualitativos, que describen los hechos o les aportan un contexto.
Se utilizan dos técnicas de modelado dimensional: el esquema de
estrella, más sencillo, y el esquema de copo de nieve, más complejo
al utilizar en alguna dimensión más que una tabla de datos.
C O NT I NU A R
4.4. Herramientas ETL y datos en tiempo real
Las herramientas actuales usadas por la gran Las empresas de menor tamaño pueden recurrir a
empresa para los procesos ETL son Powercenter de productos de código abierto ETL, que pueden
Informática, Datastage de IBM, Oracle Data emplearse de forma gratuita. Estas herramientas
Integrator o SAS Data Integrator. El alto coste de tienen niveles muy diferentes de integración y
estas aplicaciones hace que se utilicen solo en facilidades de uso en el diseño y ejecución de
grandes empresas. procesos.
Fuente: BBVA.
2
Fuente: Logicalis.
3
Fuente: Logicalis.
Lección 5 de 14
V. Analítica de datos
La ciencia de los datos en el entorno empresarial incluye el conocimiento y los procesos relacionados
con el descubrimiento de datos, su modelado, el análisis y la predicción del comportamiento, así como
el desarrollo de aplicaciones y su conversión en información o conocimiento útil para las decisiones de
la empresa: “Así como Internet es un factor de desintermediación que está afectando a muchas
cadenas de valor, el análisis de información en grandes volúmenes, de diversas fuentes, a gran
velocidad y con una flexibilidad sin precedentes puede suponer un factor diferencial para aquellos que
decidan adoptarlo” (BBVA, 2013).
Es necesario dar valor a la ingente cantidad de datos de los que disponemos para explotar todas las
posibilidades que nos ofrecen, que podemos integrar y analizar de forma inteligente para alcanzar un
mejor conocimiento de la información que contienen y obtener, así, mayores beneficios, tanto
económicos como sociales.
Por ejemplo, un sistema en el que el uso de redes de distribución eléctrica y contadores inteligentes se
integre con las redes de generación, sistemas de información geográfica, bases de datos, información
de clientes y otros sistemas centrales posibilitaría una mejor gestión y mayor eficiencia en el uso de la
energía, lo que permitiría también detectar de forma más rápida, e incluso prevenir, posibles averías y
fallos en el sistema o fraudes en el consumo.
C O NT I NU A R
C O NT I NU A R
C O NT I NU A R
C O NT I NU A R
C O NT I NU A R
5.5. La visión 360° del cliente a partir de la analítica de
datos
En el ámbito empresarial, hay una gran cantidad de Pero el verdadero valor no es la cantidad de
datos, pero solo una parte son útiles y aportan valor en datos y variables que se pueden medir, sino su
cuanto a la mejora de las actividades de la empresa. interpretación, que permite anticiparse a los
Aun después de limpiar los datos irrelevantes, queda un sucesos más relevantes para la empresa. El
gran volumen de datos de los que, en la actualidad, no análisis de la información también puede evitar
se saca provecho alguno. Una vez determinado qué pérdidas al permitir planificar personal, materias
datos son relevantes, su analítica puede ofrecer primas o maquinaria y evitar así la disminución
información de gran utilidad. de la producción.
C O NT I NU A R
C O NT I NU A R
6.3. Modelos de análisis de datos de negocio
C O NT I NU A R
6.4. Analítica predictiva
Hoy en día, la empresa genera con su actividad enormes El manejo de tanta información requiere nuevos
cantidades de datos que puede analizar y procesar para modelos capaces de ir más allá de la simple
desarrollar algoritmos o patrones de comportamiento información descriptiva, que aprenden de
que ayuden a tomar decisiones o predecir resultados en situaciones anteriores y predicen futuros
posteriores situaciones similares, como en el caso de comportamientos y colaboran de forma
retenciones de tráfico o el diagnóstico médico. decisiva en la toma de decisiones en función
de estos.
C O NT I NU A R
6.5. Modelos predictivos
Muchos autores hablan, así, del paso de big data al smart data. Para la
Fundación Telefónica, el enfoque smart data permitirá no solo realizar
predicciones, sino recomendaciones más fiables, por lo que se recurre
a él cada vez con más frecuencia en los departamentos comerciales
para mejorar su eficiencia (Fundación Telefónica, 2016).
La analítica predictiva se puede utilizar para hacer predicciones Las técnicas procedentes de la minería
acerca del futuro de las personas en las organizaciones. Para de datos han sido siempre útiles en las
ello, el análisis predictivo utiliza la estadística junto con organizaciones empresariales, pero,
algoritmos de minería de datos; así, se analizan datos actuales gracias al big data, han sido capaces de
e históricos con el fin de hacer predicciones sobre el futuro. No procesar mayores cantidades de datos,
obstante, es preciso señalar que estas predicciones no suelen sean estructurados o desestructurados,
ser absolutas, sino que más bien se trata de establecer de forma mucho más rápida (incluso en
porcentajes de probabilidad sobre sucesos futuros. tiempo real) y eficiente.
C O NT I NU A R
A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S
Permite la analítica de datos de gestión para la toma de decisiones casi en tiempo real.
A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S
Apoyo en la toma de decisiones: maneja información relevante para la consecución de los objetivos del
negocio.
A N A LÍ T I C A DE T O M A DE
A C C E S I BI LI DA D US UA R I O F I N A L
DAT O S DE C I S I O N E S
C O NT I NU A R
Hasta aquí se ha estudiado cómo se desarrollan los son los más importantes para la empresa, ya
procesos relacionados con la puesta en marcha de un que van a obtener el resultado del desarrollo
sistema de inteligencia de negocio, que incluyen la previo. Es aquí donde se van a transformar
localización de las fuentes de información y los procesos los datos en información y donde se crea el
ETL. A continuación, se estudia la explotación de datos que conocimiento necesario para la toma de
lleva a cabo el usuario final. Estos procesos decisiones en la empresa.
C O NT I NU A R
Las herramientas de usuario son las que se utilizan para hacer las
consultas y obtener la información que los diferentes usuarios
necesitan para la toma de decisiones. En la figura 7, en la parte
derecha, se pueden ver estas herramientas de explotación de datos
de negocio, que utiliza el personal encargado del sistema o
directamente el usuario de la información; en definitiva, el personal
de gestión o la dirección de la empresa, que la necesitan para la
toma de decisiones.
C O NT I NU A R
Que se puedan llevar a cabo mediante consultas sencillas y de forma eficiente, para obtener la información
con rapidez.
C A R A C TER Í STI C A TA
C O N S ULTA S LI M I TA R INFORME
S
Que sean uniformes, con lo que hay que tener en cuenta la definición de los colores, las fuentes o los filtros
que se van a utilizar para dar una apariencia homogénea.
TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME
Limitar el número de elementos del informe para que la visualización sea sencilla y que el mantenimiento y
actualización sean dinámicos.
TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME
El informe debe comprenderse de forma intuitiva y ágil, sin necesidad de aprendizaje por parte del
destinatario.
TA
C O N S ULTA S C A R A C TER Í STI C A S LI M I TA R INFORME
Que la visualización se pueda realizar en un único tablero de mando o pestaña, para evitar así la navegación.
C O NT I NU A R
Las empresas que implantan inteligencia de negocio han recorrido diversas fases anteriores, como la de
implantación de cuadros de mando integrales (CMI), sistemas de soporte a la decisión (DSS) o sistemas de
información ejecutiva (EIS). En todos los casos, las organizaciones han de haber predeterminado con
claridad tanto las métricas como los indicadores clave de negocio (KPI, por sus siglas en inglés), que son
las herramientas de medición que utilizarán para controlar sus actuaciones y realizar un seguimiento
permanente de los resultados, para medir su progreso y determinar si se están alcanzando los objetivos
marcados y, en su caso, corregir las acciones o sustituirlas por otras nuevas.
Los KPI son indicadores cuantificables que ofrecen información detallada (cifras, gráficos, bases de datos,
etc.) sobre alguno de los aspectos críticos que inciden en el rendimiento del negocio. La cuantificación de
estos datos permite realizar un análisis detallado y contrastarlo con los objetivos buscados.
Los indicadores no son estándar, pueden variar entre empresas de un mismo sector o
bien que empresas de distinta índole los compartan. Cada empresa tiene la capacidad
de implantar únicamente los indicadores adecuados a lo que quiere medir. Por ello, la
inteligencia de negocio debe programar cómo recoger la información necesaria y
aplicar los procesos adecuados para que proporcionen, de manera sencilla y de forma
periódica, los indicadores de negocio.
C O NT I NU A R
Ddetermina la probabilidad de
que un individuo pertenezca a
Clasificación un grupo en función del valor
que tengan otras variables
independientes.
C O NT I NU A R
8.5. So ware de BI
En esta página web de Power BI, se pueden ver las utilidades de esta herramienta de BI. Además, se puede
descargar de forma gratuita durante 60 días para conocer su funcionamiento (accesible a través de este
enlace).
Lección 9 de 14
Tascón define big data, de forma breve, como el También expone que “el tratamiento y gestión de
conocimiento empíricamente obtenido de los datos y enormes cantidades de datos procedentes de
los hechos puestos a nuestra disposición para tomar múltiples fuentes, como las redes sociales
decisiones. El big data está emparentado con lo que (Facebook o Twitter, por ejemplo) y las tecnologías
se ha conocido como minería de datos, un campo de de las comunicaciones, son de vital importancia en
las ciencias de la computación que intenta descubrir el contexto de la inteligencia competitiva, lo que ha
patrones en grandes volúmenes de datos. La minería fomentado el auge de tecnologías y servicios de big
de datos, al igual que el big data, utiliza los métodos data. Además, los servicios de inteligencia y
de la inteligencia artificial y la estadística para seguridad centran su interés en el proceso de estos
analizar los patrones en las bases de datos con las datos y en el desarrollo de tecnologías que
que trabaja (Tascón, 2013). permitan su transformación en conocimiento”.
Una de las definiciones más comunes de big data explica esta área como el conjunto de procesos,
tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios
datos encierran.
Asimismo, según Telefónica: “Se dice que revolucionará la salud, como acelerador del conocimiento y la
decisión clínica, y ayudará a crear tratamientos realmente eficaces y eficientes. Es la piedra angular de
las smart cities, clave en la transformación hacia la banca digital y en una nueva agricultura de precisión.
Ha dado vida al periodismo de datos, ha cambiado la forma de ver el deporte, se ha convertido en una
necesidad crítica para los negocios por la ventaja competitiva que representa…” (Telefónica, 2016).
Por tanto, el big data permite recopilar, gestionar y analizar grandes cantidades de datos procedentes de
las interacciones personales o de la multitud de dispositivos conectados del internet de las cosas, para
convertirlos en información valiosa, frente a la incapacidad de los sistemas tradicionales para procesar
tales cantidades. Saber cómo analizar estos datos en tiempo real y cómo actuar a partir de la
información resultante supone una ventaja competitiva para las organizaciones, ya que les permite una
respuesta automatizada, más rápida y flexible ante las demandas cambiantes del mercado. En un
mercado globalizado como el actual, las empresas no pueden prescindir de esta información, ni siquiera
permitirse que esta llegue con retraso.
C O NT I NU A R
C O NT I NU A R
En las encuestas realizadas para este informe, se Un 89 % de los encuestados señala que el big data
señala que el big data supone una ventaja revolucionará las operaciones de negocios, tal como
competitiva por su poder disruptivo en todos los lo hizo en su día internet. El 79 % opina que aquellas
sectores, desde servicios financieros y seguros empresas que no adopten el big data perderán
hasta servicios postales y administraciones competitividad y corren el riesgo de desaparecer.
públicas.
En cuanto al área en la que el big data tendrá más impacto en los
próximos años, los directivos encuestados señalan principalmente, y
por este orden:
C O NT I NU A R
El uso del big data está creciendo en las El uso de esta tecnología supone un potencial enorme para
empresas españolas. El 62 % utiliza ya las empresas, ya que tienen la posibilidad de recopilar,
soluciones de big data para su negocio. procesar y analizar, en tiempo real, grandes cantidades de
Además, el 74 % de los ejecutivos datos y utilizarlos para adquirir ventajas competitivas sobre
encuestados por Accenture afirma que el la competencia. La posibilidad de generar valor a partir de
big data es esencial para la transformación estos datos está transformando de forma radical la forma
digital de la empresa. La posibilidad de en que las organizaciones gestionan sus negocios. Su uso
disponer de un proceso de toma de es extrapolable a cualquier sector de actividad, desde la
decisiones rápido y fiable, basado en la medicina hasta la energía, los recursos humanos, la
información disponible, tiene un valor industria 4.0, la agricultura, la educación, la banca o los
incalculable en el futuro del negocio. seguros.
X. Resumen
En esta unidad se ha estudiado la actual importancia de los datos y los distintos métodos de análisis,
que resumimos a continuación:
Analítica web y de redes sociales
El desplazamiento del marketing y la publicidad de las empresas hacia las webs corporativas, el
buscador de Google y las redes sociales, como Facebook, han hecho necesaria la analítica para conocer
y mejorar los resultados de los costes. Alrededor de este nuevo fenómeno, los mismos buscadores y
redes sociales desarrollaron sus propias herramientas y aplicaciones de medición y analítica de estas
actividades.
El usuario de la analítica es la dirección de marketing y ventas, que utiliza datos de clientes obtenidos de
paneles de clientes, publicidad, tráfico en la web, opiniones en redes sociales, correo electrónico o la
aplicación de gestión de la relación con los clientes (CRM).
Una de las claves de esta herramienta de negocios es la facilidad con la que accede a los datos
operacionales y los sintetiza para convertirlos en información estratégica de la empresa, con el fin de
tomar mejores y más rápidas decisiones encaminadas a la consecución de los objetivos.
El término BI ha ganado en relevancia actualmente por el aumento de los datos que se ha producido por
la digitalización y, a la vez, por el desarrollo de la capacidad de procesamiento y de tratamiento de los
datos.
Big data
Término popularizado hace pocos años, se refiere al análisis de los macrodatos que está en el centro de
la transformación digital. El valor de los macrodatos radica, en realidad, en el análisis que sea capaz de
realizar cada empresa, gobierno o individuo de los datos disponibles. La gran mayoría de las compañías
solo usaban una pequeña parte de los datos estructurados procedentes de las transacciones. La
explosión de datos del tráfico de la web o las redes sociales, las máquinas o los sensores, da lugar a un
largo camino por delante para extraer el valor completo de la información que pueden obtener.
El análisis de big data es la utilización de grandes cantidades de datos producidos con gran rapidez, en
gran medida desestructurados, que los sistemas tradicionales no pueden procesar y almacenar, y que
necesitan nuevas plataformas analíticas para su análisis.
Pueden tener destinatarios diferentes en la empresa, están en un estadio de desarrollo diferente, usan
datos provenientes de fuentes diferentes y tecnologías y aplicaciones específicas en cada caso. Sin
embargo, a la vez, la metodología analítica utilizada proviene, en su gran mayoría, de la ciencia de los
datos, y la información obtenida de las diferentes analíticas, una vez resumida e integrada, se utiliza por
parte de la alta dirección de la empresa con el objetivo de mejorar la toma de decisiones. Todo ello hace
lógico pensar en la utilidad de avanzar en una visión integrada de la gestión de los datos, la analítica y las
herramientas de obtención de la información por parte de los distintos usuarios de la empresa, para ser
capaces de satisfacer la creciente necesidad de tomar las decisiones considerando no solo la
información histórica, sino utilizando los resultados de la analítica predictiva.
Lección 11 de 14
ENUNCIADO
Thyssenkrupp ha puesto en marcha MAX, “el primer sistema de mantenimiento predictivo, a tiempo real,
en la industria de los ascensores”. Basado en una combinación de tecnologías como internet de las
cosas, big data, cloud y aprendizaje automático, MAX “aumenta la disponibilidad y eficiencia de los
ascensores y reduce el tiempo de averías a través de diagnósticos en tiempo real”. Según Thyssenkrupp,
MAX está revolucionando el servicio de mantenimiento de los ascensores en el mundo.
En la siguiente figura, se recoge el funcionamiento de MAX.
SE PIDE
Explica cómo Thyssenkrupp utiliza el análisis de datos para mantenimiento predictivo de ascensores, así
como las ventajas del sistema MAX.
VER SOLUCIÓN
SOLUCIÓN
El análisis de datos también es de suma utilidad para predecir el comportamiento de las máquinas y
adelantarse a las posibles averías o problemas de funcionamiento, lo que ahorra tiempo y costes.
Thyssenkrupp ha desarrollado una solución de mantenimiento predictivo para ascensores potenciada
por la tecnología del internet de las cosas de Microsoft Azure, que es capaz de reducir el tiempo de
inactividad del ascensor hasta la mitad, lo que aumenta significativamente la disponibilidad de los
ascensores, especialmente importante en las ciudades con edificios de gran altura.
MAX utiliza diversas tecnologías, entre ellas big data, internet de las cosas (IoT) y las comunicaciones
machine to machine (M2M), con la capacidad de recibir información de diversos sensores distribuidos
en los ascensores y en los recorridos de estos, para recoger y enviar información de forma continua, así
como la tecnología de la nube a través de Azure, para recoger los datos y enviarlos a MAX.
A la vez, MAX se utiliza como una herramienta de marketing y venta de sus ascensores, que utiliza los
servicios de mantenimiento eficaz del ascensor para reducir los tiempos de paradas por averías como un
potente argumento de venta. Ahora, más que nunca, el tiempo es esencial para los ciudadanos. Al
aumentar la disponibilidad del ascensor, MAX ofrece a los trabajadores y residentes en edificios altos y
rascacielos la última tecnología para ahorrar pérdidas de tiempo debido a las averías. Tener instalado un
ascensor con el sistema de mantenimiento de MAX supone disponer de estadísticas de servicio,
disponibilidad del ascensor o de las escaleras, fecha de la última revisión, etcétera.
Así, Thyssenkrupp relata las ventajas que el cliente obtiene con un ascensor que integra MAX para su
mantenimiento predictivo:
Máxima disponibilidad y fiabilidad del ascensor.
La captura de datos sirve para ofrecer además un canal exclusivo de comunicación con los clientes de
ofertas especiales, promociones personalizadas, la consulta de la facturación, los presupuestos de
reparación o modernización, la última revisión obligatoria y su fecha de validez.
Lección 12 de 14
Lecturas
Fundación Innovación Bankinter (2015). Big data. El poder de los datos. [En línea] URL
disponible en este enlace.
Vídeos
Retos y oportunidades en Big data. [En línea] URL disponible en este enlace.
Big data de las redes sociales para predecir el comportamiento ciudadano. [En línea] URL
disponible en este enlace.
Lección 13 de 14
XIII. Glosario
Análisis combinado
–
Tipo de análisis de datos desestructurados que permite utilizar datos de texto, datos de vídeo y datos de
sensores, que da lugar a informaciones más precisas o más ajustadas a los contextos.
Análisis de discurso
–
Tipo de análisis de datos desestructurados basado en la escucha de audios de conversaciones para
analizar el contenido emocional del habla, con categorías como “enfadado”, “frustrado” o “satisfecho”.
Análisis de texto
–
Tipo de análisis de datos desestructurados que utiliza el procedimiento de extracción de la información a
partir de grandes cantidades de texto. Permite clasificar textos, extraer conceptos, resumir documentos o
analizar opiniones.
Análisis de vídeo/imágenes
–
Tipo de análisis de datos desestructurados que utiliza algoritmos que revisan cada escena y plano, y
cataloga la información para identificar patrones de referencias cruzadas que permiten la identificación
facial, el análisis de comportamientos o el conocimiento de la situación.
Análisis predictivo
–
Eel análisis predictivo utiliza la estadística junto con algoritmos de minería de datos. Se basa en el análisis
de los datos actuales e históricos para hacer predicciones sobre futuros eventos. Estas predicciones no
suelen ser afirmaciones absolutas, sino que se parecen más a eventos y su probabilidad de que sucedan
en el futuro. Se pueden distinguir tres modelos usados en los negocios:
Modelo predictivo: usa datos históricos y actuales para determinar patrones y evaluar las
probabilidades de determinados comportamientos.
Modelo descriptivo: estudia las relaciones entre los datos para establecer clasificaciones en grupos.
Modelo de decisión: analiza todos los elementos que intervienen en la toma de decisiones para
predecir los resultados de cada posible decisión.
Árboles de decisión
–
Modelo predictivo del análisis de datos que clasifica datos en conjuntos, en función de los datos de
entrada. Estas clasificaciones ayudan a entender el camino de alguien en las decisiones que adopta.
Big data
–
Tecnología que posibilita la captura, almacenamiento y procesamiento de enormes cantidades de datos,
tanto estructurados como no estructurados, que las tecnologías tradicionales no son capaces de manejar.
La información obtenida se analiza para obtener valor para la empresa y facilitar los procesos de toma de
decisiones.
Científico de datos
–
Nueva figura que surge del desarrollo de las tecnologías de big data. Se trata de un profesional con
formación lógico-formal y habilidades en matemáticas, estadística e ingeniería informática, a la vez que
domina la lógica de la investigación científica, para extraer el máximo valor de los datos disponibles en
función de las necesidades del negocio.
Cloud computing
–
Sistema de servicios informáticos que ofrece soporte para almacenamiento, bases de datos,
comunicaciones, monitorización, software y otros servicios a través de cualquier dispositivo conectado a
internet.
Cubos OLAP
–
Bases de datos multidimensionales compuestas por dimensiones y métricas que permiten tener
información, previamente agregada, con todas las combinaciones posibles de las perspectivas incluidas y,
de esta forma, visualizar las métricas que interesen al usuario, por lo que facilitan la consulta en los
sistemas de inteligencia de negocios. Las dimensiones, a su vez, tienen jerarquías y niveles. Este diseño
permite mayor capacidad de cálculo para poder realizar análisis de escenarios complejos con algoritmos
estadísticos.
Data architecture
–
Establece el conjunto de especificaciones (los modelos, políticas y reglas) que definen los requisitos
estratégicos de los datos; es decir, describe la estructura, tanto física como lógica, de los datos dentro de la
organización y cómo están interrelacionados.
Data governance
–
Parte central de la gestión de datos que se encarga de controlar, planificar y supervisar la gestión y uso de
datos en todas las demás áreas.
Data quality
–
Define, controla y mejora la calidad de los datos, lo que garantiza que no tengan defectos y que sean
precisos, consistentes y completos.
Data security
–
Función de la gestión de datos que controla todos los mecanismos y políticas encaminados a garantizar la
privacidad, confidencialidad y acceso apropiados.
Data storage
–
Función de la gestión de datos que determina cómo, cuánto y qué se almacena.
Dato
–
Información dispuesta de manera adecuada para su tratamiento por un ordenador. Así, no sirve el dato puro
si no está preparado adecuadamente para presentarse mediante software.
Datos estructurados
–
Datos que son almacenables en filas y columnas. Son el tipo de datos más empleados por los sistemas
de registro y los más sencillos de etiquetar, organizar y procesar.
Datos no estructurados
–
Se trata del tipo de datos más complejo, aquellos que se presentan en un formato que no puede ser
indexado en tablas relacionales para el análisis; son los datos de imágenes, audio, vídeo o los de las redes
sociales.
Datos semiestructurados
–
Datos que no se ajustan a un esquema fijo y explícito: documentos XML, los blogs o los sensores emplean
este tipo de datos.
Documents & contents
–
Función de la gestión de datos que establece las reglas aplicables a los datos fuera de las bases de datos.
Extracción de datos
–
Proceso ETL para obtener los datos de las fuentes de origen, que se analizan para comprobar que cumplen
con los criterios de estructura, organización y formato fijados.
HR Analytics
–
Uso estratégico de herramientas y metodologías de análisis aplicadas a macrodatos para tener un mayor
conocimiento de los empleados y colaboradores de la organización.
Información
–
Mensaje, generalmente en forma de documento o comunicación audible o visible. Su propósito es cambiar
el criterio del receptor, influir en su punto de vista o conducta. Los datos se convierten en información
cuando quien los procesa agrega significado y propósito, añade valor para convertirlos en información útil
en la toma de decisiones.
Inteligencia de negocio
–
Conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de
los sistemas transaccionales e información desestructurada en información estructurada para su
explotación directa o para su análisis y conversión en conocimiento de soporte a la toma de decisiones
sobre el negocio.
Lago de datos
–
Depósito de fácil acceso donde se almacenan y procesan una gran cantidad de datos (big data) en su
formato nativo, sin ningún tipo de transformación o tratamiento previos, para ponerlos a disposición del
usuario cuando se requieran, que utiliza para ello una arquitectura plana. Permite una entrega de datos
mucho más rápida, inteligente y clara. Los datos se vuelcan en el lago y cada usuario puede visualizar los
datos según sus necesidades específicas, con la tecnología más adecuada para esa tarea.
Minería de datos
–
Proceso de análisis que trata de buscar patrones de comportamiento que no son fácilmente identificables
a simple vista. Para ello, se hace necesaria la aplicación de complejos procesos estadísticos para
identificar correlaciones, patrones de comportamiento, grupos de afinidad o predicción de datos.
Proceso ETL
–
Herramienta que posibilita la integración de datos entre distintos sistemas o aplicaciones. Los procesos
ETL permiten que la empresa pueda obtener y relacionar datos de distintas fuentes, ordenarlos,
reformatearlos, prepararlos, cargarlos en otro sistema y utilizarlos en sus procesos de negocio. Permiten,
también, realizar estas operaciones con datos alojados en aplicaciones heredadas que aún se mantienen
en la empresa y que es preciso integrar con las nuevas aplicaciones.
Redes neuronales
–
Modelo predictivo del análisis de datos que utiliza técnicas capaces de modelar relaciones muy complejas,
a la vez que tienen la capacidad de manejar relaciones no lineales entre los datos. Se utilizan a menudo
para confirmar los hallazgos de técnicas más simples. Se basan en reconocimiento de patrones y algunos
procesos de inteligencia artificial.
Transformación de datos
–
Proceso ETL por el que se transforman los datos extraídos para ajustarlos a los criterios y restricciones del
sistema de destino y para poder realizar los cálculos precisos en su explotación.
Lección 14 de 14
XIV. Bibliografía
BBVA (2013). Big Data. Es hora de generar valor de negocio con los datos.
Fundación Innovación Bankinter (2015). El poder de los datos. Madrid: Fundación Innovación
Bankinter.
Power Data (2013). Data Management. La gestión de datos eficaz. [En línea] URL disponible en
este enlace.
Tascón, M. (2013). Introducción: Big Data. Pasado, presente y futuro. Telos: Cuadernos de
comunicación e innovación, 95:47-50.
VV. AA. (2013). Diccionario LID de inteligencia y seguridad. Madrid: LID Editorial Empresarial.
Wolfram, S. (2002). A new kind of science. Champaign (IL): Wolfram Media, Inc.