Lectura 1

Módulo 1. Introducción a
los conceptos de Business
Intelligence

Unidad 1.1Conceptos técnicos

El objetivo de la presente unidad es dar un marco conceptual sobre los
componentes a ser tratados en el presente curso. En este sentido, la función
principal es dar un marco de referencia y normalización sobre cada uno de los
conceptos o definiciones a ser utilizadas en el resto de los módulos.
1.1.1 Datawarehouse
El datawarehouse es uno de los componentes más destacados de la arquitectura
de business intelligence.
El datawarehouse es un repositorio de datos, integrado, no volátil, variable en
el tiempo y orientado al negocio (Inmon, 1992).
Integrado: la información proviene de sistemas heterogéneos, como ser base
de datos, sistemas transaccionales, archivos de textos, planillas de cálculos,
etcétera.
No volátil: los datos almacenados perduran en el tiempo (no es necesaria la
depuración).
Variable en el tiempo: es un repositorio de información histórica. El tiempo en
el cual son conservados los datos es mucho mayor que en sistemas
transaccionales o bases de datos tradicionales.
Orientado al negocio: los datos se organizan de manera tal que reflejan la
estructura que posee el negocio. El nivel de detalle a ser almacenado en el
datawarehouse se determina según las necesidades de información que tenga
el negocio.
El Datawarehouse está constituido con una organización interna (a nivel físico)
que facilita la administración y procesamiento de grandes volúmenes de datos,
1

con el objetivo de poder dar respuesta a las necesidades que posee el
negocio para la toma de decisiones (Kimball, 1996).

Figura 1: Ejemplo de fuentes de un datawarehouse

Fuente: elaboración propia

1.1.2 OLAP
OLAP es un acrónimo inglés que significa procesamiento analítico en línea (On-Line
Analytical Processing).
Debido a su conformación interna, y mediante la utilización de estructuras
multidimensionales, permite el almacenamiento de grandes volúmenes de
información que pueden ser consultados con tiempos de respuesta mucho
mejores que las bases de datos tradicionales.
Dependiendo del tipo de implementación física que se utilice, los sistemas
OLAP se dividen en ROLAP, MOLAP y HOLAP.
ROLAP (OLAP relacional): la implementación se realiza sobre bases de datos
relacionales. Los datos se estructuran utilizando distintas técnicas que tienen
como principal objetivo obtener fluidez y rapidez en las consultas que se
realicen. Algunas de las técnicas consisten en la desmoralización de las tablas
que almacenan la información, mayor redundancia de los datos y modelado
en estructuras que ayudan a obtener mejores tiempos de respuesta.
2

MOLAP (OLAP multidimensional): la implementación se realiza sobre bases de

datos multidimensionales, diseñadas para tal fin y con estructuras propias.
Algunas de las técnicas utilizadas en el diseño de dichas bases de datos
consisten en el cálculo de la información por adelantado, el uso de reglas de
compresión de datos y uso de métodos de indexación para la optimización de
las búsquedas.
HOLAP (OLAP híbrido): la implementación se realiza a la vez sobre bases de
datos relacionales y bases de datos multidimensionales. En estas
implementaciones los sistemas tienen la habilidad de utilizar una u otra técnica
dependiendo del grado de granularidad que se necesite para dar respuesta
a las solicitudes de información.
Debido a la utilización de estructuras multidimensionales, los sistemas OLAP
suelen ser asociados al concepto de cubos de información. Si bien solo pueden
ser graficadas tres dimensiones (álgebra y geometría analítica), cuando
existen mayor número de dimensiones, se continúa denominando cubo.
Otro de los conceptos asociados a los sistemas OLAP es la posibilidad de
cortar y extraer información (drill down). Esto se debe a que los ejes que
conforman el cubo de información pueden ser particionados según las
necesidades de información.
En la figura 2 (análisis OLAP), puede verse un ejemplo del concepto de cortar
y extraer información. En dicho ejemplo se está analizando la información
proveniente de un sistema de ventas; la información fue almacenada en un
cubo de información OLAP, y los tres ejes corresponden al tiempo, los datos
geográficos y los artículos.
Figura 2: Análisis OLAP
3

Fuente: elaboración propia.

1.1.3 Data Mining

Data mining es un conjunto de técnicas, procedimientos y tecnologías que tiene
como objetivo explorar y analizar grandes volúmenes de información de manera
automática o semiautomática, para responder a solicitudes de información y hacer
lo siguiente:
● Encontrar patrones ocultos y repetitivos, tendencias o reglas que
expliquen el comportamiento de los datos en un determinado contexto.
● Generar modelos predictivos, a partir de datos históricos, con el
objetivo de anticiparse a los hechos y tener mayor información para la
toma de decisiones.
Antes de la aparición de la práctica del data mining, la técnica más utilizada
para el procesamiento de información con objetivos exploratorios consistía en
la aplicación de estadística.
Las técnicas de estadísticas basaban su resultado en la aplicación manual de
los conocimientos de uno o más expertos en el uso de los algoritmos, modelos y
leyes estadísticas. La tarea requería la participación de un gran número de
expertos y sobre todo implicaba uso del tiempo, todo lo que podía
incrementarse cuando se requería procesar un gran volumen de información.
4

Data mining, por su parte, utiliza software especializado en el procesamiento
de grandes volúmenes de información, cuyos resultados se obtienen en un corto
período. Sin embargo, el rol del experto en estadística sigue siendo necesario,
no para el procesamiento de los datos, sino para la interpretación de los
modelos resultantes.
Existen dos tipos de modelos para la aplicación de técnicas de data mining:
● Clasificación: mediante la aplicación de técnicas, condiciones o reglas
se busca obtener modelos que permitan dividir o relacionar en forma
lógica el universo de datos de estudio. Algunas de las técnicas más
conocidas en este tipo de modelos son las siguientes:
● Árboles de decisión.
● Teorema de Bayes.
● Redes neuronales.
● Basadas en asociaciones.
● Predicción: mediante la construcción de un modelo que surge del
aprendizaje o entrenamiento en base a datos históricos y conocidos, se
busca encontrar o predecir los datos futuros o desconocidos. Algunas
de las técnicas más conocidas en este tipo de modelos son las
siguientes:
● Regresión lineal.
● Regresión múltiple.
● Regresión logarítmica.
El proceso por el cual se realiza el estudio de data mining se denomina
proceso de descubrimiento del conocimiento (knowledge discovery in
database, KDD).
En la figura 3, puede observarse el proceso y cada uno de sus componentes:
● Determinación de objetivos:
¿Por qué se realiza el estudio y qué se espera obtener?
¿Cuáles son los datos que serán procesados y de dónde se obtienen?
¿Existe alguna regla que es necesario aplicar?
● Preparación de los datos:
Selección de la información: ¿Cuál es el conjunto de datos que se va a utilizar?
Preprocesado: se analiza qué tan sanos y completos están los datos. Se define
qué acciones se van a tomar con aquellos que sean erróneos.
5

Transformación y reducción: Se aplican las reglas de limpieza, llenado de
información faltante y corrección de errores. También, en el caso de ser
necesario, se reduce la información a ser utilizada.
● Data mining:
Se seleccionan las técnicas a aplicar según el objetivo del estudio.
Se determina el algoritmo a utilizar.
Se pone a prueba el algoritmo seleccionado y se analizan los datos obtenidos.
En el caso de no aproximarse a lo esperado, se vuelve a seleccionar otra
técnica u otro algoritmo y se repite el proceso.
● Evaluación:
Se visualizan los datos obtenidos.
Se eliminan los datos y patrones redundantes.
Se analiza si lo datos obtenidos proveen información para la toma de
decisiones.
● Uso del conocimiento:
Los patrones obtenidos se aplican a nueva información y se procede a
ponerlos disponible para su utilización.
Se guardan los patrones obtenidos en la base de conocimiento para que
sirvan de entrada en futuros estudios.

Figura 3: Proceso de descubrimiento del conocimiento
6


Entre las muchas aplicaciones del uso de data mining, podemos detallar las
siguientes:
● Identificar patrones de compra.
● Buscar asociaciones entre clientes y características demográficas.
● Predecir respuestas a campañas de marketing.
● Detectar patrones de uso fraudulento de tarjetas.
● Identificar clientes con probabilidad de dejar de pagar un crédito.
● Determinar la logística de la distribución.
● Identificar patrones de comportamiento en pacientes con riesgo médico.
● Identificación de terapias médicas satisfactorias para distintas
enfermedades.
● Análisis de canasta de compra.
● Identificar clientes leales.
● Identificar reglas del mercado de valores.
● Detectar comportamiento fraudulento.

1.1.4 Diferencia entre OLAP y Data Mining
lOLAP y data mining son dos técnicas que trabajan sobre la información y tienen
como objetivo dar apoyo a la toma de decisiones.
Desde el punto de vista de OLAP y aprovechando sus estructuras
multidimensionales, es posible extraer y analizar información con gran rapidez
y versatilidad. Su fortaleza se base en la extracción, navegabilidad y
rapidez, y en ella, es la persona que utiliza esta técnica el actor principal que
va decidiendo por cuál camino realizar el análisis.
Por el lado de data mining, las técnicas se basan en el análisis y
procesamiento de la información en forma automática, con el objetivo de
obtener un algoritmo que resuelva las necesidades del negocio. Su fortaleza
radica en la posibilidad de encontrar patrones ocultos, descubrir relaciones y
predecir comportamientos sobre los datos que pueden cumplirse con cierta
probabilidad.
7

A modo de referencia, en la tabla 1 se ejemplifican distintas aplicaciones y
preguntas que pueden resolver cada una de estas técnicas.

Tabla 1: Análisis OLAP frente a Data Mining
OLAP DATA MINING

¿Cuál es el perfil de los clientes que
¿Cuál fue la tasa de respuesta a la
probablemente respondan a la futura
campaña?
campaña?
¿Cuáles de nuestros clientes actuales
¿Cuántas unidades del producto nuevo
son los que probablemente compren
vendimos a nuestros clientes actuales?
nuestro futuro producto?
¿Cuáles son clientes que
¿Cuáles fueron los top 10 clientes del
probablemente se pasen a la
año pasado?
competencia en los próximos 6 meses?
¿Qué clientes no renovaron contrato el ¿Cuáles son las probabilidades de que
mes pasado? éste cliente deje de pagar?
¿Qué clientes dejaron de pagar sus ¿Qué puedo hacer para bajar el
préstamos? porcentaje de defectos?
¿Qué porcentaje de las piezas

producidas ayer fueron defectuosas?

Fuente: elaboración propia
Unidad 1.2 Conceptos funcionales

El objetivo de esta unidad consiste en detallar cada uno de los componentes
funcionales que ayudan a comprender la arquitectura de business intelligence (BI).

8

1.2.1 Definición de Business Intelligence y componentes

Figura 5: Compontes de la arquitectura de business intelligence


● Datos: son las fuentes de información provenientes de sistemas

heterogéneos El objetivo es poder centralizar la información de las
múltiples fuentes en un único modelo de información.
● Entendimiento: es el conjunto de herramientas (OLAP, data mining, entre
otras) utilizadas para analizar y mejorar el conocimiento del negocio.
● Acción: con la información obtenida, los usuarios del negocio pueden
tomar decisiones o impulsar distintas iniciativas de negocio.

Tal cual se puede apreciar en la figura 4, la arquitectura de business
intelligence es un sistema cerrado. Esto se debe a que las acciones tomadas
por el negocio se convierten en nuevas fuentes de información o en procesos a
aplicar en la etapa de entendimiento. Por esta razón, se considera a business
intelligence como un sistema vivo.
9

1.2.2 Estilos de Business Intelligence

Los estilos de BI se refieren a las prácticas incluidas dentro de una arquitectura de
business intelligence. Estos estilos suelen ir actualizándose, debido al avance de la
tecnología y la aparición de nuevas maneras de procesar la información.
Actualmente, se definen siete estilos, que pueden visualizarse en la figura 5.

Figura 5: Los siete estilos de business intelligence

Fuente: Adaptado de Microstrategy Analytics Platform, 2014. Recuperado de
http://goo.gl/vXNWJ0

● Analizar:
o Análisis predictivo: comprende los procesos y metodología de data
mining.
o Análisis OLAP: comprende todas las técnicas de procesamiento de
información, utilizando cubos de información OLAP.
o Data discovery: comprende un conjunto de herramientas que tienen
como objetivo poner como disponible la información en diferentes
elementos de explotación (gráficos, filtros, etc.) de rápido acceso y de
fácil entendimiento.
10

● Monitorear:
o Reporting: comprende un conjunto de elementos tradicionales de
explotación de información, como ser grillas, gráficos y documentos.
o Tableros: comprende un conjunto de elementos avanzados de
visualización de información, con el objetivo de acceder en forma rápida
a los datos claves de negocio. Generalmente, se asocian a los conceptos
de indicadores o KPIs.

● Actuar:
o Alertas: comprende un conjunto de técnicas que utilizan distintos
disparadores (tiempo, eventos, resultado de una medición), que envían
información en forma proactiva sobre la situación de determina medida
de negocio.
o Transacciones: comprende un conjunto de herramientas que permiten
interactuar con la información presentada, ingresando datos y actuando
sobre el resultado de éstos.

1.2.3 Desafíos de Business intelligence
● Tener una única verdad: Una de las claves de las organizaciones es
que la información fluya en forma ordenada y normalizada. Esto
significa que las cifras sobre determinada medida deben interpretarse
de la misma manera por cualquier integrante de la organización. Esto
evitará las discusiones sobre el origen y procesamiento de la
información, dedicando ese tiempo a analizar el negocio y cómo
impacta esa medida. Si se sigue adelante en el ejercicio de
planeamiento estratégico de los recursos humanos, se debería llegar a
un esquema como el siguiente:

● Lograr una visión integral del negocio: toda organización está dividida en
diferentes componentes según su funcionalidad (unidades de negocio,
11

departamentos, gerencias, sectores, etcétera). En muchas oportunidades, esto
nos lleva a tener una visión de islas o silos de información, por lo que se
desaprovecha la integración y la posibilidad de ver todo como un conjunto.
● Poder acceder a la información en el momento que la necesito: se dice
habitualmente que las decisiones de negocio no pueden esperar, y en este
sentido los usuarios de negocio deberían poder acceder a la información
cuando lo requieran y con el grado de detalle que lo necesitan. Ya no se
hablan de tiempos de procesamientos medidos en segundos, minutos u horas,
ahora se indica que la información debe viajar del origen al destino tan
rápida como el negocio lo requiera.

1.2.4 Soluciones y herramientas de Business Intelligence

Según la clasificación disponible en el Cuadrante Mágico de Gartner (2016),
podemos dividir las soluciones de BI por sus funcionalidades, innovación, fortalezas
y el uso que le dan los usuarios. Es así como se dividen en los siguientes
cuadrantes:
● Leaders: son las herramientas con amplitud de propuestas para los estilos
de BI, tienen gran alcance en el mercado y una fuerza de marketing muy
importante.
● Challengers: son herramientas que tienen amplitud de propuestas para los
estilos de BI, pero con limitado alcance, ya sea por los enfoques técnicos o
por ventas
● Niche Players: son herramientas con muy buenas propuestas de business
intelligence pero que solo abordan uno o pocos estilos de BI.
● Visionaries: son herramientas con arquitecturas flexibles, con nuevas
propuestas y que aún no se encuentran estables en sus funcionalidades y
uso.
12

Esta clasificación antes mencionada en el Cuadrante Mágico de Gartner (2016)
se actualiza año a año, y cada una de las herramientas se posiciona en cada uno
de estos cuadrantes de acuerdo a su desempeño.
Figura 6: Cuadrante mágico de Gartner
Fuente: Adaptado de Gartner (2016) en Parenteau et al. Recuperado de https://goo.gl/3LF3UB

Otra clasificación que podemos abordar es un resumen de acuerdo a los estilos de
business intelligence antes estudiados, es así como podemos evaluar a las
herramientas en lo detallado a continuación:

● Herramientas de reporting, dashboard y scorecard.
● Herramientas de data Discovery.
● Herramientas de data mining.
● Herramientas de big data: esta no forma parte de los estilos de BI
definidos hasta el momento, pero su uso se está expandiendo.

En los gráficos siguientes se ejemplifican algunas de estas soluciones.

Figura 7: Reporting
13

Fuente: Adaptado de The 5 Styles of Business Intelligence, Microstrategy (2002). (Traducción
Propia)

Figura 8: Dashboard y scorecard

Fuente: Adaptado de Microstrategy Analytics Platform (2014). Recuperado de
http://goo.gl/vXNWJ0
Figura 9: Data discovery
14

Fuente: Adaptado de: Information Builders (2014), Recuperado de http://goo.gl/94qxck.
Figura 10: Data mining
Fuente: Statsoft (2013), http://goo.gl/v6TrqO.
15

Referencias

[Imagen intitulada sobre Markahall] (S.f.). Recuperado de
http://2.bp.blogspot.com/-miaU0wprBAg/T_T-pm3aEFI/AAAAAAAAACU/tAG1yiu
depU/s640/R2.png
[Imagen intitulada sobre SPSS]. (S.f.). Recuperado de http://goo.gl/W9J5ZL
[Imagen intitulada sobre Statsoft] (S.f.). Recuperado de
http://www.statsoft.nl/images/screenshot1.gif
Barrón, F. (2014). Big Data filos (un ejemplo). [Imagen]. Recuperado de
http://stf.filos.unam.mx/2014/04/big-data-filos-un-ejemplo/
BBVA (2015). Ejemplos reales del uso de Big Data. [Imagen]. BBVA. Recuperado
de
http://www.centrodeinnovacionbbva.com/noticias/ejemplos-reales-del-uso-de-
big-data
Garnet en Parenteau J. et al., (2016). Magic Quadrant for Business Intelligence
and Analytics Platforms. [ Imagen]. Recuperado de
https://www.gartner.com/doc/reprints?id=1-2XXET8P&ct=160204
Information Builders ( S.f.). Self-Service Data Discovery with InfoAssist+.
Information Builders. Recuperado de
http://www.informationbuilders.com/products/webfocus/data-discovery
Inmon, W. (1992). Building the DataWarehouse. Estados Unidos: Wiley.
Kimball, R. (1996). The Data Warehouse Toolkit: The Definitive Guide to
Dimensional Modeling.
Predictive Analytics Today ( S.f.). Data discovery and visualization using SAP
Lumira Edge Edition. ecuperado
R de
http://www.predictiveanalyticstoday.com/data-discovery-and-visualization-using
-sap-lumira-edge-edition/
SAS. The Power to know. (2016). Recuperado de
http://www.sas.com/en_gb/software/business-intelligence/visual-analytics.html
Timothy King (2016). T IBCO Updates Spotfire with Simple Data Discovery.
Solutions Review. Recuperado de
16

http://solutionsreview.com/business-intelligence/tibco-updates-spotfire-with-si
mple-data-discovery/
Urman M. (S.f.). Data Mining & Advanced Analytics Expandiendo el alcance de
sus modelos predictivos. Microstrategy Analytics Platform. R
ecuperado de
http://www.austral.edu.ar/ingenieria-posgrados/wp-content/uploads/2014/10/
Microstrategy-Mariano-Urman.pdf
Yobene ( 2013). I n-Memory analysis and reporting drives simplicity and
performance. Yobene. Recuperado de
http://www.yobene.com/Live/en_qlikview.Yobene?ActiveID=1239

17

Lectura 1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lectura 1

Cargado por

Copyright:

Formatos disponibles

Unidad 1.1Conceptos técnicos

MOLAP (OLAP multidimensional): la implementación se realiza sobre bases de

1.1.3 Data Mining

Fuente: elaboración propia.

OLAP DATA MINING

Unidad 1.2 Conceptos funcionales

1.2.1 Definición de Business Intelligence y componentes

● Datos: son las fuentes de información provenientes de sistemas

1.2.2 Estilos de Business Intelligence

1.2.4 Soluciones y herramientas de Business Intelligence

Fuente: Adaptado de Gartner (2016) en Parenteau et al. Recuperado de https://goo.gl/3LF3UB

Figura 9: Data discovery

Fuente: Adaptado de: Information Builders (2014), Recuperado de http://goo.gl/94qxck.

Figura 10: Data mining

Fuente: Statsoft (2013), http://goo.gl/v6TrqO.

También podría gustarte

Lectura 1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lectura 1

Cargado por

Copyright:

Formatos disponibles

Unidad 1.1Conceptos técnicos

MOLAP (OLAP multidimensional): la implementación se realiza sobre bases de

1.1.3 Data Mining

Fuente: elaboración propia.

OLAP DATA MINING

Unidad 1.2 Conceptos funcionales

1.2.1 Definición de Business Intelligence y componentes

● Datos: son las fuentes de información provenientes de sistemas

1.2.2 Estilos de Business Intelligence

1.2.4 Soluciones y herramientas de Business Intelligence

Fuente: Adaptado de Gartner (2016) en Parenteau et al. Recuperado de https://goo.gl/3LF3UB

Figura 9: Data discovery

Fuente: Adaptado de: Information Builders (2014), Recuperado de http://goo.gl/94qxck.

Figura 10: Data mining

Fuente: Statsoft (2013), ​http://goo.gl/v6TrqO​.

También podría gustarte

Fuente: Statsoft (2013), http://goo.gl/v6TrqO.