Está en la página 1de 73

1.1.

Conceptos de Inteligencia de
Negocios
Introducción
Desde el decenio de 1990, el contexto socioeconómico en el que se
desarrollan las actividades económicas se ha denominado
generalmente sociedad de la información y el conocimiento. Los
profundos cambios ocurridos en los métodos de producción y en las
relaciones económicas han hecho crecer la importancia del
intercambio de bienes intangibles, consistente en su mayor parte en
transferencias de información. La aceleración en el ritmo de los
procesos de transformación actuales se debe a dos factores:

1. El primero es la globalización, entendida como la


interdependencia cada vez mayor entre las economías de los
distintos países, que ha llevado al crecimiento de una economía
global única caracterizada por un alto nivel de integración.
2. El segundo son las nuevas tecnologías de la información,
marcadas por la expansión masiva de Internet y de los
dispositivos inalámbricos, que han permitido transferencias de
alta velocidad de grandes cantidades de datos y el uso
generalizado de medios de comunicación sofisticados.

En este escenario de rápida evolución, la riqueza de oportunidades de


desarrollo no tiene precedentes. El fácil acceso a la información y el
conocimiento ofrece varias ventajas a diversos actores del entorno
socioeconómico: personas, que pueden obtener noticias con mayor
rapidez, acceder a los servicios con mayor facilidad y realizar
transacciones comerciales y bancarias en línea; empresas, que
pueden desarrollar productos y servicios innovadores que puedan
satisfacer mejor las necesidades de los usuarios, logrando ventajas
competitivas a partir de un uso más eficaz de los conocimientos
adquiridos; y, finalmente, la administración pública, que puede mejorar
los servicios que se prestan a los ciudadanos mediante el uso de
aplicaciones de gobierno electrónico, como el pago en línea de las
contribuciones tributarias y las herramientas de e-salud, teniendo en
cuenta el historial médico de cada paciente, mejorando así la calidad
de los servicios sanitarios.

En este marco de transformación radical, los métodos de gobernanza


dentro de organizaciones complejas también reflejan los cambios que
ocurren en el entorno socioeconómico, y parecen cada vez más
influenciados por el acceso inmediato a la información para el
desarrollo de planes de acción efectivos. El término organizaciones
complejas se utilizará a lo largo del material para referirse
colectivamente a un conjunto diversificado de entidades que operan
en el contexto socioeconómico, incluidas empresas, agencias
gubernamentales, instituciones bancarias y financieras y
organizaciones sin fines de lucro.

La adopción de tecnologías de almacenamiento masivo de datos de


bajo costo y la amplia disponibilidad de conexiones a Internet han
puesto a disposición grandes cantidades de datos que han sido
recopilados y acumulados por las diversas organizaciones a lo largo
de los años. Las empresas que son capaces de transformar datos en
información y conocimiento pueden utilizarlos para tomar decisiones
más rápidas y efectivas y así lograr una ventaja competitiva. Del
mismo modo, por el lado de la administración pública, el análisis de la
información disponible permite el desarrollo de mejores e innovadores
servicios para los ciudadanos. Estos son objetivos ambiciosos que la
tecnología, por sofisticada que sea, no puede realizar por sí sola, sin
el apoyo de mentes competentes y metodologías de análisis
avanzadas.

¿Es posible extraer, de la enorme cantidad de datos disponibles,


conocimientos que luego puedan ser utilizados por los responsables
de la toma de decisiones para ayudar y mejorar la gobernanza de las
empresas y la administración pública?

La inteligencia empresarial puede definirse como un conjunto de


modelos matemáticos y metodologías de análisis que explotan
sistemáticamente los datos disponibles para recuperar información y
conocimientos útiles para respaldar procesos complejos de toma de
decisiones.

A pesar del significado algo restrictivo del término empresa, que


parece encerrar el tema dentro de los límites de las empresas, los
sistemas de inteligencia empresarial están dirigidos tanto a empresas
como a otros tipos de organizaciones complejas, como se mencionó
anteriormente.

Las metodologías de inteligencia empresarial son interdisciplinarias y


amplias, y abarcan varios dominios de aplicación. De hecho, se
preocupan por la representación y organización del proceso de toma
de decisiones y, por lo tanto, por el campo de la teoría de la decisión;
con la recopilación y el almacenamiento de los datos destinados a
facilitar el proceso de toma de decisiones y, por lo tanto, con las
tecnologías de almacenamiento de datos; con modelos matemáticos
para optimización y minería de datos y, por tanto, con investigación de
operaciones y estadística; finalmente, con varios dominios de
aplicación, como mercadeo, logística, contabilidad y control, finanzas,
servicios y administración pública.

Se puede decir que los sistemas de inteligencia empresarial tienden a


promover un enfoque científico y racional para la gestión de empresas
y organizaciones complejas. Incluso el uso de una hoja de cálculo
electrónica para evaluar los efectos inducidos en el presupuesto por
las fluctuaciones en la tasa de descuento, a pesar de su simplicidad,
requiere por parte de los tomadores de decisiones una representación
mental de los flujos financieros.

Un entorno de inteligencia empresarial ofrece a los responsables de la


toma de decisiones información y conocimientos derivados del
procesamiento de datos, mediante la aplicación de modelos y
algoritmos matemáticos. En algunos casos, estos pueden consistir
simplemente en el cálculo de totales y porcentajes, mientras que los
análisis más desarrollados utilizan modelos avanzados para la
optimización, el aprendizaje inductivo y la predicción.

En general, un modelo representa una abstracción selectiva de un


sistema real, diseñado para analizar y comprender desde un punto de
vista abstracto el comportamiento operativo del sistema real. El
modelo incluye únicamente los elementos del sistema que se
consideran relevantes a los efectos de la investigación realizada. Vale
la pena citar las palabras de Einstein sobre el tema del desarrollo de
modelos: "Todo debe hacerse lo más simple posible, pero no más
simple".

Las disciplinas científicas clásicas, como la física, siempre han hecho


uso de modelos matemáticos para la representación abstracta de
sistemas reales, mientras que otras disciplinas, como la investigación
de operaciones, se han ocupado de la aplicación de métodos
científicos y modelos matemáticos al estudio de sistemas artificiales,
como empresas y organizaciones complejas.

"El gran libro de la naturaleza", como escribió Galileo, "sólo puede ser
leído por quienes conocen el idioma en el que fue escrito. Y este
lenguaje son las matemáticas". ¿Se puede aplicar también al análisis
de sistemas artificiales esta profunda percepción de uno de los
hombres que abrió el camino a la ciencia moderna?
Hoy en día, las meras habilidades intuitivas de los tomadores de
decisiones que gestionan empresas o la administración pública se ven
superadas por la complejidad de la gobernanza de las organizaciones
actuales. Como ejemplo, considere el diseño de una campaña de
mercadeo en mercados dinámicos e impredecibles, donde, sin
embargo, se dispone de una gran cantidad de información sobre el
comportamiento de compra de los consumidores. Hoy en día, es
inconcebible dejar de lado la aplicación de modelos avanzados de
aprendizaje inferencial para la selección de los destinatarios de la
campaña, con el fin de optimizar la asignación de recursos y la
redención de la acción de marketing.

La interpretación del término inteligencia empresarial que se ha


ilustrado y que se pretende desarrollar en este material es mucho más
amplia y profunda en comparación con el significado estrecho
publicitado en los últimos años por muchos proveedores de software y
revistas de tecnología de la información. Según esta última visión, las
metodologías de inteligencia empresarial se reducen a herramientas
electrónicas de consulta, visualización y reporte, principalmente con
fines contables y de control. Por supuesto, nadie puede negar que el
acceso rápido a la información es una herramienta invaluable para los
tomadores de decisiones. Sin embargo, estas herramientas están
orientadas a análisis de inteligencia empresarial de carácter pasivo,
donde el decisor ya ha formulado en su mente algunos criterios para la
extracción de datos. Si se quiere que las metodologías de inteligencia
empresarial sean capaces de expresar su enorme potencial
estratégico, se debe recurrir a formas activas de apoyo a la toma de
decisiones, basadas en la adopción sistemática de modelos
matemáticos capaces de transformar los datos no solo en información
sino también en conocimiento, y luego el conocimiento en una ventaja
competitiva real.

Inteligencia de negocios (BI)


El advenimiento de las tecnologías de almacenamiento de datos de
bajo costo y la amplia disponibilidad de conexiones a Internet han
facilitado que las personas y las organizaciones accedan a grandes
cantidades de datos. Dichos datos suelen ser heterogéneos en origen,
contenido y representación, ya que incluyen transacciones
comerciales, financieras y administrativas, rutas de navegación web,
correos electrónicos, textos e hipertextos, y los resultados de pruebas
clínicas, por nombrar solo algunos ejemplos. Su accesibilidad abre
escenarios y oportunidades prometedores, y plantea una pregunta
atractiva: ¿es posible convertir esos datos en información y
conocimiento que luego puedan ser utilizados por los tomadores de
decisiones para ayudar y mejorar la gobernanza de las empresas y de
la administración pública?

BI se puede definir como un conjunto de modelos matemáticos y


metodologías de análisis que explotan los datos disponibles para
generar información y conocimiento útil para procesos complejos de
toma de decisiones.

Para definir BI se partirá de la definición del glosario de términos de


Gartner :
[1]

"BI es un proceso interactivo para explorar y analizar información


estructurada sobre un área (normalmente almacenada en
una bodega de datos), para descubrir tendencias o patrones, a partir
de los cuales derivar ideas y extraer conclusiones.

El proceso de Business Intelligence incluye la comunicación de los


descubrimientos y efectuar los cambios.

Las áreas incluyen clientes, proveedores, productos, servicios y


competidores."

Pero descompongamos detalladamente esta definición:

 Proceso interactivo: al hablar de BI estamos suponiendo que


se trata de un análisis de información continuado en el tiempo,
no sólo en un momento puntual. Aunque evidentemente este
último tipo de análisis puede aportar valor, es incomparable con
lo que puede aportar un proceso continuado de análisis de
información, en el que por ejemplo se puede ver tendencias,
cambios, variabilidades, etc.
 Explorar: En todo proyecto de BI hay un momento inicial en el
que por primera vez se accede a información que facilita su
interpretación. En esta primera fase, lo que se hace es
"explorar" para comprender qué sucede en el negocio; es
posible incluso que se descubra nuevas relaciones que hasta el
momento se desconocían.
 Analizar: Se pretende descubrir relaciones entre variables,
tendencias, es decir, cuál puede ser la evolución de la variable,
o patrones. Si un cliente tiene una serie de características, cuál
es la probabilidad que otro con similares características actué
igual que el anterior.
 Información estructurada y bodega de datos: La información
que se utiliza en BI está almacenada en tablas relacionadas
entre ellas. Las tablas tienen registros y cada uno de los
registros tiene distintos valores para cada uno de los atributos.
Estas tablas están almacenadas en lo que se conoce como
bodega de datos o almacén de datos (DW). Más adelante será
definido con mayor precisión, pero se trata de una base de datos
en las que se almacenan dichas tablas.
 Área de análisis: Todo proyecto de BI debe tener un objeto de
análisis concreto. Se puede centrar en los clientes, los
productos, los resultados de una localización, etc., que se
pretende analizar con detalle y con un objetivo concreto: por
ejemplo, la reducción de costes, el incremento de ventas, el
aumento de la participación de mercado, el ajuste de previsiones
de venta, el cumplimiento los objetivos de venta
presupuestados, etc.
 Comunicar los resultados y efectuar los cambios: Un
objetivo fundamental del BI es que, una vez descubierto algo,
sea comunicado a aquellas personas que tengan que realizar
los cambios pertinentes en la organización para mejorar la
competitividad.

La definición proporcionada capta por completo la idea de que existe


una jerarquía impuesta a los diferentes ámbitos de la inteligencia.
Además, esta definición también expone dos nociones críticas:

 Una práctica de BI es más que una simple colección de


herramientas. Esto significa que sin los procesos y las personas
adecuadas, las herramientas tienen poco valor.
 El valor de BI se materializa en el contexto de una acción
empresarial rentable. Esto significa que si se ignoran los
conocimientos que pueden utilizarse para una acción rentable, la
práctica tiene poco valor.

Desafortunadamente, las palabras datos e información se usan


indistintamente. Para aclarar los conceptos que serán usados en el
material, a continuación se presenta la definición de los términos
datos, información y conocimiento.

 Los datos son una colección de elementos de valor en bruto o


hechos que se utilizan para calcular, razonar o medir. Los datos
pueden recopilarse, almacenarse o procesarse, pero no pueden
colocarse en un contexto del que se pueda inferir cualquier
significado.
 La información es el resultado de recopilar y organizar datos de
manera que se establecen relaciones entre elementos de datos,
lo que proporciona contexto y significado.
 El conocimiento es el concepto de comprensión de la
información basada en patrones reconocidos de manera que
proporcione información sobre la información.

Convertir datos en información


El proceso de convertir datos en información se puede resumir como
el proceso de determinar qué datos se recopilarán y gestionarán y en
qué contexto. Un buen ejemplo es el proceso de diseño de una base
de datos que modela un conjunto de entidades del mundo real, como
las partes, que es un término de uso frecuente que se refiere a
personas y organizaciones, junto con los roles asumidos por esas
partes.

Fuera de contexto, los bits individuales de datos, como los nombres y


las fechas de nacimiento, tienen poco valor, como se muestra en la fig.
1.

Fig. 1 – Ejemplo de datos.

 
Al establecer qué bits de datos se usarán para configurar una
descripción de una parte, así como también crear instancias y poblar
esas instancias con los valores de datos relacionados, se logra crear
el contexto para esos datos y se logra convertir en un fragmento de
información, como se muestra en la fig. 2.
Fig. 2 – Ejemplo de información.
 
Se podría decir que este aspecto de BI involucra la infraestructura de
gestión y presentación de datos, que incorpora las plataformas de
hardware, los sistemas de bases de datos relacionales o de otro tipo y
las herramientas de software asociadas. Este aspecto también
incorpora herramientas de consulta y reporte que brindan acceso a los
datos. Por último, esta parte del proceso no se puede realizar sin
expertos en el área de gestión de datos que integren y coordinen esta
tecnología.
Convertir la información en conocimiento
A veces sucede cuando uno despierta en medio de la noche o tal vez
mientras uno está atrapado en el tráfico o incluso mientras se está
soñando despierto en la ducha. Es ese destello de intuición que
aparece casi como por arte de magia y que proporciona la respuesta a
ese problema particularmente desagradable por el que se ha estado
agonizando. Es muy adecuado comparar el concepto de convertir la
información en conocimiento con ese destello de percepción, debido a
que se acumula mucha información, que luego se analizan de muchas
formas diferentes hasta que se crean algunos fragmentos críticos de
conocimiento. Lo que hace que ese conocimiento sea crítico es que
puede usarse para formar un plan de acción para resolver algún
problema comercial.

Fig. 3 – Formación del conocimiento.


 
Se puede decir que este aspecto de BI involucra los componentes
analíticos, como el almacenamiento de datos, el procesamiento
analítico en línea (OLAP), la calidad de los datos, la elaboración de
perfiles de datos, el análisis de reglas de negocios y la minería de
datos. Nuevamente, adquirir herramientas para realizar estas
funciones tiene poco valor en ausencia de profesionales que
entiendan cómo usarlas y cómo obtener el tipo correcto de resultados.

Convertir el conocimiento en planes de acción


Este último aspecto es probablemente el más importante, porque es
en este contexto donde se deriva cualquier valor real. Si se está
utilizando BI para micro mercadeo, encontrar el cliente adecuado para
un producto es irrelevante si no se tiene un plan para comunicarse con
ese cliente. Si se está utilizando BI para la detección de fraudes,
encontrar el patrón de fraude tiene poco valor si la organización no
hace algo para prevenir ese comportamiento fraudulento.

Poder actuar en función de la inteligencia que se ha aprendido es el


punto clave de cualquier estrategia de BI. Es a través de estas
acciones que un patrocinador de la alta dirección puede ver el
verdadero retorno de la inversión de su gasto en tecnología de la
información (TI). Un programa de BI brinda beneficios que aumentan
la eficiencia comercial, aumentan las ventas, brindan una mejor
orientación al cliente, reducen los costos de servicio al cliente,
identifican el fraude y, en general, aumentan las ganancias al tiempo
que reducen los costos. Debido a esto, se podría decir que cuando se
implementa correctamente, BI es un área de TI que puede ser un
centro de ganancias en lugar del centro de costos tradicional.

Conocimiento procesable
Ese último punto es tan crítico que vale la pena mencionarlo por
segunda vez: el conocimiento descubierto tiene poco valor si no existe
una acción que produzca valor que pueda emprenderse como
consecuencia de la obtención de ese conocimiento. Esto significa que
la asociación empresa-tecnología debe trabajar en conjunto no solo
para actuar sobre la inteligencia descubierta, sino para hacerlo de
manera oportuna a fin de obtener el mayor beneficio. Esto refuerza el
sentimiento de que BI puede tener éxito como resultado de la
cooperación entre los desarrolladores técnicos y sus clientes
comerciales.

Aplicación de BI
BI puede manejar grandes cantidades de datos para ayudar a
identificar y desarrollar nuevas oportunidades para el negocio.
Aprovechar estas nuevas oportunidades y aplicarles un esquema
productivo puede proporcionar un beneficio de mercado comparable y
estabilidad a largo plazo.
Ejemplos:

1. Imagine que es el gerente de ventas de una gran organización


minorista y que, con cierta probabilidad, pudo predecir cuánto
dinero iba a gastar cada uno de sus clientes y qué productos iba
a comprar cada uno durante los próximos seis meses.
2. Como gerente de productividad, imagine que puede averiguar
qué equipos de producción dentro de su organización
construyen productos de la más alta calidad.
3. Imagine que, como planificador que negocia los contratos de
generación y suministro de electricidad para una región del país,
pudiera predecir con relativa precisión cuál sería la demanda de
electricidad durante los próximos 90 días.
4. Imagine que está a cargo de administrar la cadena de suministro
de su propia empresa y que puede determinar cuál de sus
proveedores proporciona los productos de la más alta calidad
con mayor rapidez.
5. Usted es el administrador de retención de clientes de una
compañía de tarjetas de crédito y puede identificar a los clientes
que están a punto de cortar su tarjeta de crédito un mes antes
de que lo hagan.

Seguramente estará de acuerdo en que cada una de estas personas


se encuentra en una posición envidiable, porque cada una tiene un
conocimiento especial sobre una situación empresarial que transmite
alguna ventaja empresarial. Estos son solo algunos ejemplos del tipo
de conocimiento que se puede exponer y explotar mediante el uso de
BI.

En los últimos años, la capacidad de crear, recopilar y almacenar


información ha superado ampliamente la capacidad de hacer un uso
significativo de esa información. Sin embargo, existe un valor oculto
significativo encerrado en las bases de datos corporativas, a la espera
de ser descubierto y explotado. Pero para exponer este valor oculto,
primero se debe comprender cómo capacitarse usted mismo y a los
colegas para pensar en la información de una manera diferente. En
lugar de tratar los datos como la materia prima que alimenta una línea
de ensamblaje al estilo del siglo XIX disfrazado de procesamiento de
información del siglo XX, se debe aprender a pensar en los datos de
una empresa como un activo de información corporativa, uno que
puede manipularse de diferentes maneras, en beneficio corporativo.

¿Por qué BI?


¿Qué impulsa el deseo de un programa de BI? Se piensa que una BI
adecuada puede conducir a:

 Mayor rentabilidad. Por ejemplo, según los consultores


financieros, en una cartera típica de un banco minorista, el 20 %
de las cuentas aportan utilidades equivalentes al 200 % del
rendimiento total, mientras que más de la mitad de las cuentas
generan pérdidas. BI puede ayudar a los clientes empresariales
a evaluar el valor de por vida del cliente y las expectativas de
rentabilidad a corto plazo y a utilizar este conocimiento para
distinguir entre clientes rentables y no rentables.
o Disminución de costos. Ya sea que se trate de una
mejor gestión de la logística, menores costos operativos
(como menores costos de almacenamiento y entrega) o
una disminución de las inversiones necesarias para
realizar ventas, BI se puede utilizar para ayudar a evaluar
los costos organizacionales.
o Gestión mejorada de la relación con el cliente (CRM ). [2]

Se trata de una aplicación de BI que aplica el análisis de la


información agregada del cliente para proporcionar una
mejor capacidad de respuesta del servicio al cliente,
descubrir oportunidades de venta cruzada y venta
superior, y aumentar la lealtad general del cliente.
o Disminución del riesgo. La aplicación de métodos de BI
a los datos crediticios puede mejorar el análisis del riesgo
crediticio, mientras que el análisis de la actividad y la
confiabilidad tanto del proveedor como del consumidor
puede proporcionar información sobre cómo optimizar la
cadena de suministro.

Por supuesto, hay muchos otros beneficios si se construye una


práctica de BI dentro de una organización. Algunos de ellos se centran
en las preguntas más básicas sobre cómo hace negocios una
empresa. Por ejemplo, es sorprendente ver cómo pocos gerentes
senior dentro de una empresa pueden responder preguntas simples
sobre su negocio, como:

 ¿Cuántos clientes tiene?


 Para cada producto, ¿cuántos se vendieron durante los últimos
12 meses?
 ¿Quiénes son sus 20 mejores clientes?
 ¿Cuál es el valor de un cliente en particular?
 ¿Quiénes son sus 20 mejores proveedores?
Lo que es aún más interesante es que en algunas organizaciones, no
solo no pueden responder a estas preguntas, es posible que ni
siquiera exista un marco en el que alguien pueda hacer estas
preguntas. Hay un punto crítico que se desea señalar aquí: comenzar
una práctica de BI bien concebida y completa no solo proporcionará
las herramientas físicas para responder este tipo de preguntas, sino
que, lo que es más importante, debería ser un catalizador para un
cambio en la forma en que se piensa hacer negocios y en cómo se
puede utilizar la información dentro de esa nueva forma de pensar.

Por ejemplo, antes de poder determinar quiénes son los 20 mejores


clientes, se debe poder articular la diferencia entre un cliente "bueno"
y un "malo", así como también poder identificar una colección de
métricas utilizadas para medir la bondad, qué conjuntos de datos
deben recopilarse para la medición, establecer e integrar los métodos
para recopilar y agregar los datos utilizados para la medición,
establecer los procesos necesarios para realizar la medición,
garantizar la calidad de esos datos para no sacar conclusiones
erróneas, empaquetar el resultados en un informe razonable y
encontrar un método para difundir rápida y eficazmente los resultados
de este proceso. Aunque gran parte de este proceso puede
automatizarse utilizando tecnología estándar, la parte más importante
(es decir, hacer la pregunta correcta) necesita la participación de
personas con experiencia y participación en el resultado.

El activo de la información
Aunque se ha invertido una cantidad significativa de dinero en intentos
de construir y lanzar marcos y aplicaciones de BI, la mayor parte de
ese dinero se ha gastado en infraestructura, mientras que se ha
invertido muy poco en administrar y explotar un activo corporativo
valioso: los datos de una empresa. De hecho, el concepto de BI está
tan mal definido que las expectativas de un gerente se establecen en
función de lo que le dice a ese gerente el último proveedor de
herramientas de software. Debido a la falta de enfoque o la ausencia
de criterios claros de éxito, muchas implementaciones de
almacenamiento de datos se han retrasado o descartado por completo
debido a que las implementaciones de BI reales no cumplen con sus
expectativas.

Por otro lado, hay una serie de organizaciones que han comenzado a
ver sus datos como un activo corporativo y a darse cuenta de que la
recopilación, agregación y análisis adecuados de sus datos abre una
oportunidad para descubrir bits de conocimiento que pueden mejorar
el procesamiento operativo y proporcionar una mejor comprensión de
los perfiles y el comportamiento de los clientes. En estos entornos,
existe un claro acuerdo sobre la definición de BI como un conjunto de
herramientas y metodologías diseñadas para explotar el conocimiento
procesable descubierto en el activo de información de la empresa.

Explotación de la información
Cualquiera que esté involucrado en el proceso de BI está preocupado
por la capacidad de explotar la información de una manera que pueda
mejorar la forma en que opera una empresa (o cualquier
organización). Sin embargo, el objetivo final de la explotación de datos
se basa en una pirámide de abstracción (ver fig. 3) que se relaciona
con las formas en que se administra la información, y la capacidad de
proporcionar acceso a ese activo de conocimiento primero debe
administrar de manera efectiva el flujo de información hacia una
plataforma de inteligencia.

Fig. 3 – La pirámide de abstracción.


 
La capacidad de explotar la información de manera eficaz se basa en
una evolución jerárquica de la gestión de la información y las
capacidades de gestión del conocimiento, cada una de las cuales
tiene sus propios beneficios y dificultades.

BI y éxito del programa


Probablemente, en algún lugar dentro de la jerarquía de la alta
gerencia corporativa, algunas personas se han convencido de que es
valioso iniciar un programa de BI. Desafortunadamente, las
percepciones dispares de lo que es BI y cómo se puede utilizar el
conocimiento derivado de BI a menudo conducen al fracaso del
proyecto.

Al observar las empresas que han comenzado proyectos de


almacenamiento de datos o que han comprado paquetes de software
de minería de datos a gran escala, se pueden ver grandes
expectativas y muchas decepciones relacionadas con la falla en la
forma en que los proyectos de almacenamiento de datos se conciben,
diseñan, gestionan e implementan, por alguna o todas las razones
siguientes:

 La comprensión amorfa de lo que podrían hacer los métodos y


productos de BI resultó en la ausencia de una propuesta de
valor adecuada en nombre del patrocinador comercial.
 El alcance del proyecto no se entendió completamente, lo que
provocó retrasos en la entrega al patrocinador comercial.
 La capacitación técnica insuficiente impidió a los desarrolladores
obtener productos de software para hacer lo que los
proveedores dijeron que hacen.
 El conocimiento deficiente de la infraestructura tecnológica dio
lugar a una planificación y programación deficientes.
 Los usuarios comerciales no pudieron confiar en los resultados
debido a la mala calidad de los datos.
 La falta de una declaración clara de los criterios de éxito, junto
con la falta de formas de medir el éxito del programa, llevó a una
percepción de fracaso.

Decisiones efectivas y oportunas


En organizaciones complejas, públicas o privadas, las decisiones se
toman de forma continua. Tales decisiones pueden ser más o menos
críticas, tener efectos a largo o corto plazo e involucrar a personas y
roles en varios niveles jerárquicos. La capacidad de estos trabajadores
del conocimiento para tomar decisiones, tanto a nivel individual como
comunitario, es uno de los principales factores que influyen en el
desempeño y la fuerza competitiva de una organización determinada.

La mayoría de los trabajadores del conocimiento toman sus decisiones


principalmente utilizando metodologías fáciles e intuitivas, que tienen
en cuenta elementos específicos como la experiencia, el conocimiento
del dominio de la aplicación y la información disponible. Este enfoque
conduce a un estilo de toma de decisiones estancado que es
inapropiado para las condiciones inestables determinadas por cambios
frecuentes y rápidos en el entorno económico. De hecho, los procesos
de toma de decisiones dentro de las organizaciones de hoy son a
menudo demasiado complejos y dinámicos para ser tratados de
manera efectiva a través de un enfoque intuitivo y, en cambio,
requieren una actitud más rigurosa basada en metodologías analíticas
y modelos matemáticos. Varios autores han señalado recientemente la
importancia y el valor estratégico de la analítica en la determinación de
la ventaja competitiva para las empresas.

El objetivo principal de los sistemas de BI es proporcionar a los


trabajadores del conocimiento herramientas y metodologías que les
permitan tomar decisiones efectivas y oportunas:

 Decisiones efectivas. La aplicación de métodos analíticos


rigurosos permite a los tomadores de decisiones confiar en
información y conocimiento que son más confiables. Como
resultado, son capaces de tomar mejores decisiones y diseñar
planes de acción que permitan alcanzar sus objetivos de una
manera más eficaz. De hecho, recurrir a métodos analíticos
formales obliga a los responsables de la toma de decisiones a
describir explícitamente tanto los criterios para evaluar opciones
alternativas como los mecanismos que regulan el problema que
se investiga. Además, el examen y el pensamiento en
profundidad resultantes conducen a una conciencia y una
comprensión más profundas de la lógica subyacente del proceso
de toma de decisiones.
 Decisiones oportunas. Las empresas operan en entornos
económicos caracterizados por niveles crecientes de
competencia y alto dinamismo. Como consecuencia, la
capacidad de reaccionar rápidamente a las acciones de los
competidores y a las nuevas condiciones del mercado es un
factor crítico para el éxito o incluso la supervivencia de una
empresa.

La fig. 4 ilustra los principales beneficios que una organización


determinada puede obtener de la adopción de un sistema de BI. Al
enfrentarse a problemas complejos y cambiantes, los tomadores de
decisiones se plantean una serie de preguntas y desarrollan el análisis
correspondiente. Por lo tanto, examinan y comparan varias opciones,
seleccionando entre ellas la mejor decisión, dadas las condiciones en
cuestión.

Fig. 4 – Beneficios de un sistema de BI.

 
Si los responsables de la toma de decisiones pueden confiar en un
sistema de BI que facilite su actividad, se puede esperar que la calidad
general del proceso de toma de decisiones mejore considerablemente.
Con la ayuda de algoritmos y modelos matemáticos, es posible
analizar un mayor número de acciones alternativas, lograr
conclusiones más precisas y tomar decisiones efectivas y oportunas.
Por tanto, la principal ventaja que se deriva de la adopción de un
sistema de BI se encuentra en la mayor eficacia del proceso de toma
de decisiones.

El papel de los modelos matemáticos


Un sistema de BI proporciona a los responsables de la toma de
decisiones información y conocimientos extraídos de los datos,
mediante la aplicación de modelos y algoritmos matemáticos. En
algunos casos, esta actividad puede reducirse a cálculos de totales y
porcentajes, representados gráficamente por histogramas simples,
mientras que los análisis más elaborados requieren el desarrollo de
modelos avanzados de optimización y aprendizaje.

En términos generales, la adopción de un sistema de BI tiende a


promover un enfoque científico y racional de la gestión de empresas y
organizaciones complejas. Incluso el uso de una hoja de cálculo para
estimar los efectos sobre el presupuesto de las fluctuaciones en las
tasas de interés, a pesar de su simplicidad, obliga a los tomadores de
decisiones a generar una representación mental del proceso de flujos
financieros.

Las disciplinas científicas clásicas, como la física, siempre han


recurrido a modelos matemáticos para la representación abstracta de
sistemas reales. Otras disciplinas, como la investigación de
operaciones, en cambio, han explotado la aplicación de métodos
científicos y modelos matemáticos al estudio de sistemas artificiales,
por ejemplo, organizaciones públicas y privadas.

El enfoque racional típico de un análisis de BI se puede resumir


esquemáticamente en las siguientes características principales.

 Primero, se identifican los objetivos del análisis y se definen los


indicadores de desempeño que se utilizarán para evaluar
opciones alternativas.
 Luego, se desarrollan modelos matemáticos aprovechando las
relaciones entre las variables de control del sistema, los
parámetros y las métricas de evaluación.
 Finalmente, se realizan análisis hipotéticos para evaluar los
efectos en el desempeño determinados por variaciones en las
variables de control y cambios en los parámetros.

Si bien el objetivo principal es mejorar la efectividad del proceso de


toma de decisiones, la adopción de modelos matemáticos también
brinda otras ventajas, que se pueden apreciar particularmente a largo
plazo:

1. El desarrollo de un modelo abstracto obliga a los tomadores de


decisiones a enfocarse en las características principales del
dominio analizado, induciendo así una comprensión más
profunda del fenómeno bajo investigación.
2. El conocimiento sobre el dominio adquirido al construir un
modelo matemático se puede transferir más fácilmente a largo
plazo a otros individuos dentro de la misma organización,
permitiendo así una preservación más nítida del conocimiento
en comparación con los procesos empíricos de toma de
decisiones.
3. Un modelo matemático desarrollado para una tarea específica
de toma de decisiones es tan general y flexible que en la
mayoría de los casos se puede aplicar a otras situaciones
subsiguientes para resolver problemas de tipo similar.

 
Bibliografía
 Pérez Marqués, María (2015), Business Intelligence: Técnicas,
herramientas y aplicaciones (1ª Ed.), México D.F., México,
Alfaomega.
 Cano, Josep Lluís (2007), Business Intelligence: Competir con
Información, Barcelona, España, ESADE Business School.
 Vercellis, Carlo (2009), Business Intelligence: Data Mining and
Optimization for Decision Making, Politecnico di Milano, Italy,
John Wiley & Sons, Ltd.
 Loshin, David (2003), Business Intelligence – The Savvy
Manager's Guide, San Francisco, USA, Morgan Kaufmann
Publishers.

 
1.2. Herramientas de Inteligencia de
Negocios.
1.3. Bodega de datos y Despensa de
datos..
Introducción
Desde mediados de la década de 1990 se sintió la necesidad de una
separación lógica y material entre las bases de datos que alimentan
los datos de entrada a los sistemas de soporte de decisiones y
arquitecturas de inteligencia de negocios, por un lado, y los sistemas
de información operacional, por el otro.

A continuación, se describe las características de las bodegas de


datos (data warehouse) y las despensas de datos (data marts),
describiendo los factores que llevaron a su concepción, destacando
las principales diferencias entre ellos y los sistemas operativos, y
discutiendo los requisitos relacionados con la calidad de los datos.

Definición de Bodega de datos (Data warehouse)


Como sugiere su nombre, una bodega de datos es el principal
repositorio de los datos disponibles para desarrollar arquitecturas de
inteligencia de negocios y sistemas de apoyo a la toma de decisiones.
El término almacenamiento de datos indica el conjunto completo de
actividades interrelacionadas involucradas en el diseño,
implementación y uso de una bodega de datos.

Es posible identificar tres categorías principales de datos que ingresan


a una bodega de datos, como se describe a continuación.

 Datos internos. Los datos internos se almacenan en su mayor


parte en las bases de datos, denominadas sistemas
transaccionales o sistemas operativos, que son la columna
vertebral de un sistema de información de negocios. Los datos
internos se recopilan a través de aplicaciones transaccionales
que presiden rutinariamente las operaciones de una
organización, como administración, contabilidad, producción y
logística. Esta colección de aplicaciones de software
transaccional se denomina planificación de recursos
empresariales (ERP).
Los datos almacenados en los sistemas operativos generalmente
se refieren a las principales entidades involucradas en los
procesos de una organización, como por ejemplo clientes,
productos, ventas, empleados y proveedores. Estos datos suelen
provenir de diferentes componentes del sistema de información:


1. Sistemas de back-office, que recopilan registros
transaccionales básicos como pedidos, facturas,
inventarios, datos de producción y logística.
2. Sistemas de atención al cliente, que contienen datos que
se originan en las actividades del centro de llamadas,
asistencia al cliente, ejecución de campañas de mercadeo.
3. Sistemas basados en la web, que recopilan transacciones
de ventas en sitios web de comercio electrónico, visitas a
sitios web, datos disponibles en formularios llenados por
clientes actuales y potenciales.
 Datos externos. Hay varias fuentes de datos externos que
pueden usarse para ampliar la riqueza de información
almacenada en las bases de datos internas. Por ejemplo,
algunas agencias recopilan y ponen a disposición datos
relacionados con las ventas, la participación de mercado y las
predicciones de tendencias futuras para industrias comerciales
específicas, así como indicadores económicos y financieros.
Otras agencias proporcionan datos de encuestas de mercado y
opiniones de los consumidores recopilados a través de
cuestionarios.

Otra fuente importante de datos externos son los sistemas de


información geográfica (SIG), que representan un conjunto de
aplicaciones para adquirir, organizar, almacenar y presentar datos
territoriales. Estos contienen información relativa a entidades que
tienen una posición geográfica específica. Por lo tanto, cada
entidad está asociada con coordenadas de latitud y longitud, junto
con algunos otros atributos, que generalmente se originan en
bases de datos relacionales y en realidad dependen del dominio
de la aplicación. Por tanto, estos datos permiten realizar análisis
temáticos sobre los datos asociados a elementos geográficos y
visualizar gráficamente los resultados.

 Información personal. En la mayoría de los casos, los


tomadores de decisiones que realizan un análisis de inteligencia
de negocios también se basan en la información y las
evaluaciones personales almacenadas en hojas de trabajo o
bases de datos locales ubicadas en sus computadoras. La
recuperación de dicha información y su integración con datos
estructurados de fuentes internas y externas es uno de los
objetivos de los sistemas de gestión del conocimiento.

Las aplicaciones de software que están en el corazón de los sistemas


operativos se denominan procesamiento de transacciones en línea
(OLTP). Por otro lado, todo el conjunto de herramientas destinadas a
realizar análisis de inteligencia de negocios y dar soporte a los
procesos de toma de decisiones recibe el nombre de procesamiento
analítico en línea (OLAP). Por lo tanto, se puede asumir que la función
de una bodega de datos es proporcionar datos de entrada a las
aplicaciones OLAP.

Hay varias razones para implementar una bodega de datos por


separado de las bases de datos que admiten aplicaciones OLTP en
una organización, siendo las más relevantes:

1. Integración. En muchos casos, los sistemas de apoyo a la toma


de decisiones deben acceder a información que se origina en
varias fuentes de datos, distribuidas en diferentes partes de una
organización o que se deriva de fuentes externas. Entonces se
requiere una bodega de datos que integre fuentes múltiples y, a
menudo, heterogéneas para promover y facilitar el acceso a la
información. La integración de datos se puede lograr mediante
diferentes técnicas, por ejemplo, utilizando métodos de
codificación uniformes, convirtiendo a unidades de medida
estándar y logrando una homogeneidad semántica de la
información.
2. Calidad. Los datos transferidos desde los sistemas operativos a
la bodega de datos se examinan y corrigen para obtener
información confiable y libre de errores, en la mayor medida
posible, lo cual aumenta el valor práctico de los sistemas de
inteligencia de negocios desarrollados a partir de los datos
contenidos en una bodega de datos.
3. Eficiencia. Las consultas destinadas a extraer información para
un análisis de inteligencia de negocios pueden resultar onerosas
en términos de recursos informáticos y tiempo de
procesamiento. Como consecuencia, si una consulta "asesina"
se dirigiera a los sistemas transaccionales, se correría el riesgo
de comprometer gravemente la eficiencia requerida por las
aplicaciones de planificación de recursos empresariales, con
consecuencias negativas en las actividades rutinarias de una
organización. Entonces, una mejor solución es dirigir consultas
complejas para análisis OLAP a la bodega de datos, físicamente
separado de los sistemas operativos.
4. Extensibilidad. Los datos almacenados en los sistemas
transaccionales se extienden durante un período de tiempo
limitado en el pasado. De hecho, debido a las limitaciones en la
capacidad de la memoria, los datos relativos a períodos pasados
se eliminan regularmente de los sistemas OLTP y se archivan
permanentemente en dispositivos de almacenamiento masivo
fuera de línea, como DVD o cintas magnéticas. Por otro lado, los
sistemas de inteligencia de negocios y los modelos de
predicción deben acceder a todos los datos anteriores
disponibles para poder captar tendencias y detectar patrones
recurrentes. Esto es posible debido a la capacidad de los
almacenes de datos para retener información histórica.

A la luz de los comentarios anteriores, se puede definir una bodega de


datos como una colección de datos que respaldan los procesos de
toma de decisiones y los sistemas de inteligencia de negocios que
tienen las siguientes características.

1. Orientado a entidades. Los datos contenidos en una bodega


de datos se refieren principalmente a las principales entidades
de interés para el análisis, como productos, clientes, pedidos y
ventas. Por otro lado, los sistemas transaccionales están más
orientados a las actividades operativas y se basan en cada
transacción individual registrada por las aplicaciones de
planificación de recursos empresariales. Durante un análisis de
inteligencia de negocios, la orientación hacia las entidades
permite evaluar más fácilmente el desempeño de una
organización y detectar cualquier fuente potencial de
ineficiencias.
2. Integrado. Los datos que se originan en las diferentes fuentes
se integran y homogeneizan a medida que se cargan en una
bodega de datos. Por ejemplo, las unidades de medida y las
codificaciones se armonizan y hacen coherentes.
3. Variante de tiempo. Todos los datos ingresados en una bodega
de datos están etiquetados con el período de tiempo al que se
refieren, por lo que se pueden relacionar de manera justa los
datos almacenados en una bodega de datos con una secuencia
de instantáneas no volátiles, tomadas en momentos sucesivos y
que llevan la etiqueta del período de referencia. Como
consecuencia, la dimensión temporal en cualquier bodega de
datos es un elemento crítico que juega un papel predominante.
De esta manera, las aplicaciones de soporte de decisiones
pueden desarrollar análisis de tendencias históricas.
4. Persistente. Una vez que se han cargado en una bodega de
datos, los datos generalmente no se modifican más y se
mantienen de forma permanente. Esta función facilita la
organización del acceso de solo lectura por parte de los usuarios
y simplifica el proceso de actualización, evitando la
concurrencia, que es de vital importancia para los sistemas
operativos.
5. Consolidado. Por lo general, algunos datos almacenados en
una bodega de datos se obtienen como resúmenes parciales de
datos primarios que pertenecen a los sistemas operativos de los
que se originan. Por ejemplo, una empresa de telefonía móvil
puede almacenar en una bodega de datos el costo total de las
llamadas realizadas por cada cliente en una semana,
subdividido por rutas de tráfico y por tipo de servicio
seleccionado, en lugar de almacenar las llamadas individuales
registradas por los sistemas operativos. El motivo de dicha
consolidación es doble: por un lado, la reducción del espacio
necesario para almacenar en la bodega de datos todos los datos
acumulados a lo largo de los años; por otro lado, la información
consolidada puede satisfacer mejor las necesidades de los
sistemas de inteligencia de negocios.
6. Desnormalizado. A diferencia de las bases de datos operativas,
los datos almacenados en una bodega de datos no están
estructurados en forma normal, sino que pueden prever
redundancias, para permitir un tiempo de respuesta más corto a
consultas complejas.

La granularidad representa el nivel más alto de detalle expresado por


los datos primarios contenidos en una bodega de datos, también
conocidos como datos atómicos. Obviamente, la granularidad de una
bodega de datos no puede exceder la de las fuentes de datos
originales. En general, es estrictamente menor debido a la
consolidación dirigida a reducir la ocupación de almacenamiento,
como se describió anteriormente.

La filosofía de diseño detrás de los almacenes de datos es bastante


diferente de la adoptada para las bases de datos operativas. La tabla
1 resume las principales diferencias entre los sistemas OLTP y OLAP.
Tabla 1 – Principales diferencias entre los sistemas OLTP y
OLAP.

Despensa de datos (Data mart)


Las despensas de datos son sistemas que recopilan todos los datos
requeridos por un departamento específico de la organización, como
mercadeo o logística, con el fin de realizar análisis de inteligencia de
negocios y ejecutar aplicaciones de apoyo a la decisión específicas de
la función en sí. Por lo tanto, una despensa de datos se puede
considerar como una bodega de datos funcional o departamental de
un tamaño más pequeño y de un tipo más específico que la bodega de
datos general de la organización.

Por lo tanto, una despensa de datos contiene un subconjunto de los


datos almacenados en la bodega de datos de la organización, que
generalmente se integran con otros datos que el departamento de la
organización responsable de la despensa de datos posee y considera
de interés. Por ejemplo, una despensa de datos de mercadeo
contendrá datos extraídos de la bodega de datos central, como
información sobre clientes y transacciones de ventas, pero también
datos adicionales relacionados con la función de mercadeo, como los
resultados de campañas de mercadeo realizadas en el pasado.
Los almacenes de datos y las despensas de datos comparten, por
tanto, el mismo marco tecnológico. Para implementar aplicaciones de
inteligencia de negocios, algunas organizaciones prefieren diseñar y
desarrollar de forma incremental una serie de despensas de datos
integrados en lugar de una bodega de datos central, con el fin de
reducir el tiempo de implementación y las incertidumbres relacionadas
con el proyecto.

Calidad de datos
La necesidad de verificar, preservar y mejorar la calidad de los datos
es una preocupación constante de los responsables del diseño y
actualización de una bodega de datos. Los principales problemas que
pueden comprometer la validez e integridad de los datos se muestran
en la tabla 2.

Tabla 2 – Integridad de los datos: problemas, causas y


soluciones.

De manera más general, se puede identificar los siguientes factores


principales que pueden afectar la calidad de los datos.

Exactitud. Para que sean útiles para análisis posteriores, los datos
deben ser muy precisos. Por ejemplo, es necesario verificar que los
nombres y codificaciones estén representados correctamente y que
los valores estén dentro de los rangos admisibles.

Completitud. Para evitar comprometer la precisión de los análisis de


inteligencia de negocios, los datos no deben incluir una gran cantidad
de valores perdidos. Sin embargo, se debe tener en cuenta que la
mayoría de las técnicas de aprendizaje y minería de datos son
capaces de minimizar de manera robusta los efectos de la
incompletitud parcial de los datos.

Consistencia. La forma y el contenido de los datos deben ser


consistentes en las diferentes fuentes de datos después de los
procedimientos de integración, con respecto a la moneda y las
unidades de medida.

Oportunidad. Los datos deben actualizarse con frecuencia, en


función de los objetivos del análisis. Es habitual organizar una
actualización de la bodega de datos con regularidad a diario o, como
máximo, semanalmente.

No redundancia. Se debe evitar la repetición y la redundancia de


datos para evitar el desperdicio de memoria y posibles
inconsistencias. Sin embargo, los datos se pueden replicar cuando la
desnormalización de una bodega de datos puede resultar en tiempos
de respuesta reducidos a consultas complejas.

Relevancia. Los datos deben ser relevantes a las necesidades del


sistema de inteligencia de negocios con el fin de agregar valor real a
los análisis que se realizarán posteriormente.

Interpretabilidad. El significado de los datos debe ser bien entendido


e interpretado correctamente por los analistas, también basándose en
la documentación disponible en los metadatos que describen una
bodega de datos.

Accesibilidad. Los analistas y las aplicaciones de apoyo a la toma de


decisiones deben poder acceder fácilmente a los datos.

Arquitectura de la bodega de datos


En la fig. 1 se muestra la arquitectura de referencia de una bodega de
datos.
Fig. 1 – Arquitectura de una bodega de datos.

La arquitectura de referencia de una bodega de datos incluye los


siguientes componentes funcionales principales:

 La bodega de datos en sí, junto con despensas de datos


adicionales, que contiene los datos y las funciones que permiten
acceder, visualizar y quizás modificar los datos.
 Aplicaciones de adquisición de datos, también conocidas como
extraer, transformar y cargar (ETL) o herramientas de back-end,
que permiten extraer, transformar y cargar los datos en la
bodega de datos.
 Aplicaciones de inteligencia de negocios y soporte de
decisiones, que representan el front-end y permiten a los
trabajadores del conocimiento realizar los análisis y visualizar
los resultados.

La distinción de tres niveles se aplica a la arquitectura mostrada,


incluso desde una perspectiva tecnológica.

 El nivel de las fuentes de datos y las herramientas ETL


relacionadas que normalmente se instalan en uno o más
servidores.
 El nivel de la bodega de datos y cualquier despensa de datos,
posiblemente disponible también en uno o más servidores, y
separados de los que contienen las fuentes de datos. Este
segundo nivel también incluye los metadatos que documentan el
origen y el significado de los registros almacenados en la
bodega de datos.
 El nivel de los análisis que aumentan el valor de la información
contenida en una bodega de datos a través de consultas,
informes y posiblemente herramientas sofisticadas de apoyo a la
toma de decisiones. Las aplicaciones para la inteligencia de
negocios y el análisis de soporte de decisiones generalmente se
encuentran en servidores separados o directamente en la PC
cliente utilizada por analistas y trabajadores del conocimiento.

Las mismas plataformas de sistema de gestión de bases de datos


utilizadas para desarrollar sistemas transaccionales también se
adoptan para implementar almacenes de datos y despensas de datos.
Debido a los requisitos de respuesta que plantean las consultas
complejas dirigidas a una bodega de datos, las plataformas de
sistemas de gestión de bases de datos utilizadas para el
almacenamiento de datos están sujetas a diferentes estructuraciones
y parametrizaciones con respecto a los sistemas transaccionales.

Una bodega de datos se puede implementar de acuerdo con


diferentes enfoques de diseño:

De arriba hacia abajo. La metodología descendente se basa en el


diseño general de la bodega de datos y, por lo tanto, es más
sistemática. Sin embargo, implica tiempos de desarrollo más
prolongados y mayores riesgos de no completarse dentro del
cronograma, ya que en realidad se está desarrollando toda la bodega
de datos.

De abajo hacia arriba. El método ascendente se basa en el uso de


prototipos y, por lo tanto, las extensiones del sistema se realizan de
acuerdo con un esquema paso a paso. Este enfoque suele ser más
rápido, proporciona resultados más tangibles, pero carece de una
visión general de todo el sistema a desarrollar.

Mezclado. La metodología mixta se basa en el diseño general de la


bodega de datos, pero luego procede con un enfoque de creación de
prototipos, mediante la implementación secuencial de diferentes
partes de todo el sistema. Este enfoque es muy práctico y
generalmente preferible, ya que permite dar pasos pequeños y
controlados teniendo en cuenta el panorama completo.

Los pasos en el desarrollo de una bodega de datos o una despensa


de datos se pueden resumir de la siguiente manera.
 Se identifican uno o más procesos dentro de la organización a
representar en la bodega de datos, como ventas, logística o
contabilidad.
 Se identifica la granularidad adecuada para representar los
procesos seleccionados y se define el nivel atómico de los
datos.
 A continuación, se eligen las medidas relevantes que se
expresarán en las tablas de hechos para el análisis
multidimensional.
 Finalmente, se determinan las dimensiones de las tablas de
hechos.

Resumen
Una base de datos transaccional es una fuente de datos mediante la
cual se mantiene el trabajo transaccional diario de los sistemas de
información originales (OLTP). También se hacen análisis de los datos
en tiempo real sobre la misma base de datos (OLAP).

Como problemas más comunes, la base de datos transaccional


perturba el trabajo transaccional diario de los sistemas de información
originales ("killer queries"). Se debe hacer por la noche o en fines de
semana. Además, la base de datos está diseñada para el trabajo
transaccional, no para el análisis de los datos. Generalmente no
puede ser en tiempo real.

Para operar eficientemente con los datos, los costos de


almacenamiento masivo y conectividad se han reducido drásticamente
en los últimos años. Parece razonable recopilar los datos (información
histórica) en un sistema separado y específico, conocido como
Almacén o Bodega de Datos.

Respecto a los datos en una bodega de datos:

 Son relativos a un periodo de tiempo y deben ser incrementados


periódicamente.
 Son almacenados como fotos (snapshots) correspondientes a
periodos de tiempo.
 No son actualizados, solo son incrementados. Las operaciones
de inserción, actualización y borrado de los datos se realizan en
la base de datos operacional antes de que sean cargados en la
bodega de datos.
Fig. 2 – Operaciones en una base de datos operacional y una
bodega de datos.

Bibliografía
 Pérez Marqués, María (2015), Business Intelligence: Técnicas,
herramientas y aplicaciones (1ª Ed.), México D.F., México,
Alfaomega.
 Cano, Josep Lluís (2007), Business Intelligence: Competir con
Información, Barcelona, España, ESADE Business School.
 Vercellis, Carlo (2009), Business Intelligence: Data Mining and
Optimization for Decision Making, Politecnico di Milano, Italy,
John Wiley & Sons, Ltd.
 Loshin, David (2003), Business Intelligence – The Savvy
Manager's Guide, San Francisco, USA, Morgan Kaufmann
Publishers.

1.4. Propósito del OLAP.


Introducción
Existen dos tipos de bases de datos que son diferentes en su
propósito y en su diseño, pero se complementan dentro de un modelo
de BI: bases de datos OLAP y bases de datos OLTP.

Bases de datos OLTP


Los sistemas OLTP (Procesamiento de Transacciones en Línea –
OnLine Transaction Procesing) son bases de datos orientadas al
procesamiento de transacciones y se conocen comúnmente como
bases de datos transaccionales.

Una transacción siempre genera un proceso atómico que debe ser


validado por medio de un commit o invalidado por medio de un
rollback, y puede involucrar operaciones de inserción, modificación y
borrado de datos. Este proceso transaccional es típico de las bases de
datos operacionales, y sus características principales son:

 El acceso a los datos se optimiza para tareas de lectura y


escritura.
 Existe un estructuramiento de los datos según el nivel de
aplicación, esto significa que los datos se estructuran
dependiendo si el sistema es un CRM, o un ERP, o un sistema
de información departamental etc.
 En muchas ocasiones no hay uniformidad de los datos,
pudiendo existir falta de compatibilidad entre estos.
 El historial de datos suele limitarse a datos actuales o recientes.

Bases de datos OLAP

Los sistemas OLAP (Procesamiento Analítico en Línea – OnLine


Analitical Procesing), son bases de datos orientadas al proceso
analítico sobre grandes cantidades de información. Estos análisis
suelen implicar la lectura de grandes cantidades de datos con el
objetivo de extraer algún tipo de información útil, como tendencias de
ventas, patrones de comportamiento de los consumidores, elaboración
de informes complejos, etc., y son típicos de las despensas de datos,
siendo sus características principales:

 El acceso a los datos suele ser de solo lectura, donde la acción


más común es la consulta con muy pocas inserciones,
actualizaciones o eliminaciones.
 Los datos se estructuran según las áreas del negocio, y los
formatos de los datos están integrados de manera uniforme en
toda la organización.
 El historial de los datos es a largo plazo, normalmente de 2 a 5
años.
 Para cargar las bases de datos OLAP con información, se
utilizan los sistemas operacionales existentes, utilizando para
esto un proceso de extracción, transformación y carga (ETL).
Tabla 1 – Diferencias entre las bases de datos OLAP y OLTP.

Conceptos básicos de OLAP


OLAP es una experiencia en bases de datos que se ha optimizado
para consultar y describir, en lugar de procesar transacciones. Los
datos OLAP se extraen de datos históricos y se agregan en
estructuras que permiten un análisis complicado. Los datos en OLAP
también se coordinan jerárquicamente y se colocan en cubos en lugar
de tablas. Es una tecnología sofisticada que beneficia a las estructuras
multidimensionales para proporcionar un acceso rápido a los datos
para su análisis. Esta asociación facilita que un informe de tabla
dinámica o un informe de gráfico dinámico muestre resúmenes de alto
nivel, como las ventas totales en toda una región, y también muestre
los detalles de los sitios donde las ventas son particularmente fuertes.

Las bases de datos OLAP contienen dos tipos básicos de datos:


medidas, que son datos numéricos, las cantidades y promedios que
usa para tomar decisiones empresariales debidamente documentadas,
y dimensiones, que son las categorías que usa para coordinar con
estas medidas. Las bases de datos OLAP ayudan a coordinar los
datos en muchos niveles de detalles mediante el uso de categorías
idénticas con las que está familiarizado para analizar los datos.

Componentes de OLAP

La fig. 1 muestra los componentes de un sistema OLAP.

Fig. 1 – Componentes de un sistema OLAP.

A continuación, se presenta una breve descripción de cada


componente.

Cubo: Es una estructura de datos que agrega las medidas por los
niveles y jerarquías de cada una de las dimensiones que desea
analizar. Los cubos combinan algunas dimensiones, como el
tiempo y la geografía, con datos resumidos, como las ventas o
las cifras de inventario.
Es un conjunto de valores en un cubo que se basan en una
Medida:
columna en la tabla de detalles del cubo y que generalmente son
tipos numéricos. Las medidas son los valores centrados en el
cubo que se procesan previamente, se agregan y se analizan.

Ejemplo: ventas, ganancias y cargos.


Miembro: Un elemento en una jerarquía que comprende una o más
ocurrencias de datos. Un miembro puede ser único o no único.
Miembro Es un miembro de una dimensión cuyo valor se calcula en
calculado: tiempo de ejecución utilizando una expresión.

Ejemplo: un miembro calculado (ganancia), se puede calcular


restando el valor del miembro (cargos) del valor del
constituyente (ventas).
Dimensión: Un conjunto de una o más jerarquías organizadas de niveles en
un cubo que el usuario comprende y se beneficia como base
para el análisis de datos.

Ejemplo: una dimensión geográfica puede incluir niveles de


país, región, estado, provincia y ciudad, etc.
Jerarquía: Una estructura de árbol lógica que organiza los miembros de
una dimensión de modo que cada miembro tiene un miembro
padre y ninguno o más miembros hijos. Un miembro hijo es un
miembro del siguiente nivel inferior en una jerarquía que está
exactamente relacionada con el miembro actual.

Ejemplo: En una jerarquía de tiempo que contiene las


calificaciones Trimestral, Mensual y Diaria, junio es un
miembro hijo de Cuarto2. Un padre es un miembro en el
siguiente nivel superior en una jerarquía que está exactamente
relacionada con el miembro actual. Por ejemplo, en una
jerarquía de tiempo que contiene las calificaciones Trimestral,
Mensual y Diaria, Cuarto1 es el padre del mes de enero.
Nivel: Dentro de una jerarquía, los datos se pueden organizar en
niveles de detalle más pequeños y más altos, como el nivel de
año, trimestre, mes, semana y día en caso de jerarquía de
tiempo.
 

La fig. 2 muestra la relación entre los componentes OLAP.


Fig. 2 – Relación entre los componentes OLAP.

Ventajas de un OLAP
El sistema OLAP presenta las siguientes ventajas:

Coherencia de la información y los resultados calculados. No importa


cuánto o qué tan rápido se procesan los datos a través de programas o
servidores OLAP, el resultado del reporte se ofrece como un producto
confiable, por lo que los analistas y ejecutivos habitualmente entienden qué
a. buscar y dónde.
Esto es especialmente útil cuando se comparan datos de informes anteriores
con datos presentes en informes nuevos y futuros proyectados, ya que evita
la larga discusión sobre quién tiene los datos correctos.
Los escenarios "¿Qué pasaría si…?" son algunos de los usos más populares
b. de los programas OLAP y se hacen eminentemente más posibles mediante
el procesamiento multidimensional.
Permite a un supervisor arrastrar datos desde una base de datos OLAP en
términos muy amplios. En otras palabras, generar informes puede ser tan
c. fácil como comparar un par de líneas de datos en una columna de una hoja
de cálculo o tan complejo como ver todos los aspectos de una montaña de
datos.
OLAP es una tecnología que se puede distribuir a muchos usuarios
d.
utilizando una variedad de plataformas.
La presentación multidimensional puede crear una comprensión de las
e.
conexiones que antes no se habían realizado.
OLAP crea una única etapa para toda la información y los requisitos
f.
comerciales; presupuestación, previsión, descripción y análisis.
g. La curva de aprendizaje para utilizar OLAP es insignificante.
 
Herramientas OLAP, ROLAP y MOLAP
Las herramientas de OLAP se caracterizan por ofrecer una visión
multidimensional de los datos (matricial), no imponer restricciones
sobre el número de dimensiones, ofrecer simetría para las
dimensiones, permitir definir de forma flexible (sin limitaciones) las
dimensiones (restricciones, agregaciones y jerarquías entre ellas),
ofrecer operadores intuitivos de manipulación (como drill-down, roll-up,
slice-and-dice y pivot) y también por ser transparentes al tipo de
tecnología que soporta la bodega de datos (ROLAP o MOLAP).

La bodega de datos y las herramientas OLAP se pueden clasificar de


la siguiente manera:

 Sistemas ROLAP: se implementan sobre tecnología relacionada,


pero dispone de algunas facilidades para mejorar el rendimiento
(índices de mapas de bits, índices de JOIN).
 Sistemas MOLAP: dispone de estructuras de almacenamiento
específicas (arreglos) y técnicas de compactación de datos que
favorecen el rendimiento del almacén.
 Sistemas HOLAP: sistemas híbridos entre los dos anteriores.

En el caso de los Sistemas ROLAP, la bodega de datos se construye


sobre un SGBD Relacional. Los fabricantes de SGBD relacionales
ofrecen extensiones y herramientas para poder utilizar el SGBDR
como un Sistema Gestor de Bodegas de Datos. Entre estas
extensiones se encuentran habitualmente los índices de mapa de bits,
los índices de JOIN, técnicas de particionamiento de los datos,
optimizadores de consultas y extensiones del SQL (operador CUBE,
ROLL-UP, etc.).

En el caso de los sistemas MOLAP, el propósito específico son las


estructuras de datos (arreglos) y las técnicas de compactación. El
objetivo de los sistemas MOLAP es almacenar físicamente los datos
en estructuras multidimensionales de forma que la representación
externa y la representación interna coincidan.

El servidor MOLAP construye y almacena datos en estructuras


multidimensionales. La herramienta de OLAP presenta estas
estructuras multidimensionales. Los datos suelen ser arreglos
extraídos de la bodega de datos. El almacenamiento y los procesos
son muy eficientes y la complejidad de la base de datos se oculta a los
usuarios. Además, el análisis se hace sobre datos agregados y
métricas o indicadores pre-calculados.
El esquema siguiente pretende relacionar toda esta tipología de
conceptos.

Fig. 3 – Relación de toda la tipología de conceptos.

La fig. 4 muestra una comparación entre los sistemas ROLAP y


MOLAP.
Fig. 4 – Comparación entre los sistemas ROLAP y MOLAP.

Los sistemas ROLAP pueden aprovechar la tecnología relacional,


pueden utilizarse sistemas relacionales genéricos (más baratos o
incluso gratuitos) y el diseño lógico corresponde al físico si se utiliza el
diseño de Kimball.

Los sistemas MOLAP generalmente son más eficientes que los


ROLAP y presentan un costo de los cambios en la visión de los datos
y de la construcción de las estructuras multidimensionales.

Metadatos
El término metadatos se refiere a "datos sobre datos". El término es
ambiguo, ya que se utiliza para dos conceptos muy distintos:

1. Los metadatos estructurales son datos de la creación y


especificación de organizaciones de datos y se denominan más
correctamente "datos sobre los contenedores de datos".
2. Los metadatos descriptivos son datos sobre el contenido de
los datos. En este caso, un recuento útil sería "datos sobre el
contenido de los datos" o "contenido sobre el contenido", por lo
tanto, el metacontenido.
Los metadatos (metacontenido) se encuentran generalmente en los
catálogos de tarjetas de presentación de las bibliotecas. A medida que
los datos se han vuelto progresivamente digitales, los metadatos se
utilizan además para contar datos digitales utilizando medidas de
metadatos exactas para control y usos particulares. Al describir el
contenido y el contexto de los documentos de datos, el valor de los
datos/archivos originales es mucho mayor.

Por ejemplo, una página web puede contener metadatos que


identifiquen en qué idioma está escrito, qué herramientas se utilizaron
para crearla y dónde proceder para obtener más información sobre el
tema, lo que permite que los navegadores mejoren automáticamente
el conocimiento de los usuarios.

Los metadatos (metacontenido) se caracterizan como los datos que


proporcionan información sobre uno o más aspectos de los datos,
como:

 Medios de creación de los datos


 Finalidad de los datos
 Hora y fecha de creación
 Creador o autor de los datos
 Ubicación en una malla de computadora donde se crearon los
datos

Por ejemplo, una imagen digital puede incluir metadatos que describen
el tamaño de la imagen, la profundidad del tono, la resolución de la
imagen, cuándo se creó la imagen y otros datos.

Los metadatos de un documento de texto pueden incluir información


sobre la extensión del documento, quién es el autor, cuándo se
escribió el artículo y un breve resumen del artículo.

Como tal, los metadatos se pueden almacenar y organizar en una


base de datos, a menudo denominada registro de metadatos o
repositorio de metadatos. Sin embargo, sin contexto y una referencia,
podría ser imposible identificar los metadatos con solo mirarlos.

Por ejemplo, por sí misma, una base de datos que consta de varias
cifras, con 10 dígitos de longitud, podría ser el resultado de resultados
calculados o una lista de números para cerrar en una ecuación; pero
sin ningún otro contexto, las cifras en sí pueden verse sólo como los
datos.
Fig. 5 – Ejemplo de metadata.

Tipos de metadatos

Hay tres tipos principales de metadatos:

 Los metadatos descriptivos describen un recurso con fines tales


como descubrimiento e identificación. Puede incluir elementos
como título, resumen, autor y palabras clave. Los elementos de
muestra son identificadores únicos (PURL , Handle URL ,
[1] [2]

atributos físicos (medio, condición de dimensiones) y atributos


bibliográficos (título, autor/creador, idioma, palabras clave).
 Los metadatos estructurales indican cómo se unen los objetos
compuestos.

Ejemplo: cómo se ordenan las páginas para formar capítulos.

Los elementos de muestra son etiquetas de estructuración como la


página de título, la tabla de contenido, los capítulos, las partes, etc.

 Los metadatos administrativos proporcionan información para


ayudar a administrar un recurso, como cuándo y cómo se creó,
tipo de archivo y otra información técnica, y quién puede
acceder a él.

Hay dos subtipos de metadatos administrativos:

1. Metadatos de gestión de derechos, que tratan de los derechos


de propiedad intelectual.
2. Metadatos de preservación, que contienen la información
necesaria para archivar y preservar un recurso.

Los elementos de muestra incluyen datos técnicos como tipo y modelo


de escáner, resolución, profundidad de bits, espacio de color, formato
de archivo, compresión, fuente de luz, propietario, fecha de copyright,
etc.

Funciones de los metadatos

1. Descubrimiento de recursos.

 Permitir que los recursos se descubran según los criterios


aplicables.
 Identificación de activos.
 Traer activos similares de forma simultánea.
 Distinguir activos no similares.
 Dar información de ubicación.

2. Organización de recursos electrónicos.

 Organizar enlaces a recursos según la audiencia o el tema.


 Crear estas páginas dinámicamente a partir de metadatos
retenidos en bases de datos.

3. Facilitar la interoperabilidad.

 Al utilizar metadatos caracterizados, protocolos compartidos y


patrones de diseños, se pueden buscar recursos en la red de
manera más fluida.
 Búsqueda entre sistemas, por ejemplo, utilizando el protocolo
Z39.50 .
[3]

4. Identificación digital.

 Componentes para números estándar como ISBN.


 La ubicación de un objeto digital también se puede asignar
utilizando:
o Un nombre de archivo.
o Una URL.

 
Ventaja de los metadatos

Una de las principales ventajas de los metadatos es que la


redundancia y las inconsistencias se pueden identificar más fácilmente
a medida que los metadatos están centralizados.

Ejemplo: el catálogo del sistema y el diccionario de datos pueden


ayudar o guiar a los desarrolladores en la fase conceptual o estructural
o para un mayor mantenimiento.

Consultas basadas en metadatos


Para documentar el significado de los datos contenidos en una bodega
de datos, se recomienda configurar una estructura de información
específica, conocida como metadatos, es decir, datos que describen
datos. Los metadatos indican la fuente original de los datos para cada
atributo de una bodega de datos, su significado y las transformaciones
a las que han sido sometidos. La documentación proporcionada por
los metadatos debe mantenerse constantemente actualizada para
reflejar cualquier modificación en la estructura de la bodega de datos.
La documentación debe ser directamente accesible para los usuarios
de la bodega de datos, de acuerdo con los derechos de acceso
correspondientes a las funciones de cada analista.

En particular, los metadatos deben realizar las siguientes tareas


informativas:

 Una documentación de la estructura de la bodega de datos:


diseño, vistas lógicas, dimensiones, jerarquías, datos derivados,
localización de cualquier despensa de datos.
 Una documentación de la genealogía de los datos, obtenida
etiquetando las fuentes de datos de las que se extrajeron los
datos y describiendo cualquier transformación realizada en los
propios datos.
 Una lista que mantiene las estadísticas de uso de la bodega de
datos, indicando cuántos accesos a un campo o vista lógica se
han realizado.
 Una documentación del significado general de la bodega de
datos con respecto al dominio de la aplicación, proporcionando
la definición de los términos utilizados y describiendo
completamente las propiedades de los datos y las políticas de
carga.
Un bloque de metadatos es un grupo de metadatos con nombre en un
formato específico. Un bloque de metadatos puede contener piezas de
metadatos individuales, como un autor o la hora de creación, y
bloques de metadatos adicionales. El nombre de un bloque de
metadatos es muy definido por su formato.

Por ejemplo, un bloque de metadatos que incluya metadatos de App1


se llamaría "app1". Los formatos de metadatos comunes incluyen
App1, Exif, IFD y XMP.

La fig. 6 ilustra la composición de una imagen JPEG de ejemplo con


cuatro bloques de metadatos de origen: App0, App1, XMP y un bloque
no identificado. Cada elemento indica el tipo de metadatos (bloque o
pieza) y la expresión de consulta utilizada para recuperar los datos.

Fig. 6 – Archivo de imagen con datos de clasificación.

 
Una pieza de metadatos es un par de nombre/valor que describe
características como autor, nombre y calificación. Una señal de ruta
contiene uno o más títulos de bloques de metadatos. También puede
identificar una pieza de metadatos dentro de un bloque de metadatos.
La siguiente expresión de ruta comprende un bloque App1 que a su
vez comprende un bloque IFD que a su vez comprende la pieza de
metadatos:

/app1/ifd/{ushort=18249}

 
Anatomía de una expresión de ruta

Para obtener acceso a los metadatos, se debe utilizar una expresión


de consulta completamente calificada en la mayoría de los casos.
Entonces, ¿qué es una expresión de consulta completamente
calificada? Una expresión completamente calificada es una cadena
que comienza con la barra inclinada de la característica de ruta (/),
seguida por una ruta de navegación a un bloque de metadatos o una
pieza de metadatos específica. Cada paso dentro de la ruta de
navegación está separado por una barra, formando una expresión
para acceder a un bloque de metadatos o un elemento de metadatos.

Ejemplo: la siguiente es una expresión de consulta completamente


calificada que accede a la clasificación de fotografías de Microsoft en
un bloque IFD que está anidado en un bloque App1:

/app1/ifd/{ushort = 18249}

Cuando se procesa esta expresión, primero se busca el bloque de


metadatos App1 dentro de los metadatos de la imagen. Si se
encuentra el bloque App1, continúa buscando el bloque de metadatos
IFD anidado. Si se encuentra el bloque IFD, se examina la pieza de
metadatos específica.

Si en algún momento no se encuentra un bloque o pieza de


metadatos, se cancela la consulta.
 
Selección de bloques

La expresión de consulta de metadatos más simple es una expresión


para obtener un lector/escritor de consultas para un bloque de
metadatos exacto. Obtener un lector/escritor de consultas permite
dirigir consultas posteriores exactamente a un bloque de metadatos
anidado sin considerar su bloque principal. Una expresión de consulta
de selección de bloque es una ruta de navegación hacia el anhelado
bloque de metadatos. Por ejemplo, en el ejemplo anterior hay cinco
bloques de metadatos, dos de los cuales están anidados en otros
bloques de metadatos. Las siguientes son las expresiones de ruta
para cada bloque de metadatos en el ejemplo de JPEG:

/app0 /app1/ifd /xmp

/app1 /app1/ifd/exif
Cuando se utiliza un lector/escritor de consultas para ejecutar una
consulta, este devuelve un nuevo lector/escritor de consultas que
atiende consultas dentro del alcance del bloque de metadatos en
particular. Por ejemplo, si se ejecuta la consulta “/app1”, se obtiene un
nuevo lector de libros de consultas y las consultas al nuevo lector de
libros están relacionadas con el bloque App1. Esto significa que la
consulta "/ifd" es legítima para el nuevo lector porque el bloque
App1 contiene un bloque IFD. Sin embargo, "/xmp" no funcionaría
porque este bloque App1 no comprende un bloque de metadatos
XMP.

Para el ejemplo de JPEG, se puede utilizar la siguiente expresión de


ruta indexada:

/[0]app1/[0]ifd

En el lenguaje de consulta, todos los índices comienzan en cero. En la


expresión anterior, el primer cero consulta para el primer bloque App1
y el segundo cero consulta el primer bloque IFD anidado. La notación
de índice aún se puede utilizar incluso cuando varios bloques del
mismo tipo ya no existen. Si el JPEG de ejemplo incluye un segundo
bloque App1 con un bloque IFD incrustado, la
expresión "/[1]app1/ifd" se utilizaría para acceder al segundo
bloque App1.

La siguiente expresión accede a la clasificación de Microsoft Photo en


el bloque XMP:

/xmp/xmp:Rating

La parte "xmp:" de la expresión es un identificador de esquema. XMP


es un punto de referencia extensible y permite a entidades de terceros
publicar sus propios esquemas que indican cómo comprar ciertos
elementos de metadatos.

Los siguientes tipos de datos son aceptados por el dialecto de


consulta:

char ushort int ride high wstr

uchar long uint twice guid

short ulong longlong str bool


El dialecto de consulta no distingue entre mayúsculas y minúsculas y
trata todas las características individuales como minúsculas. Sin
embargo, algunos formatos de metadatos (como XMP) distinguen
entre mayúsculas y minúsculas. Cuando se emplea con un formato de
metadatos que distingue entre mayúsculas y minúsculas, se utiliza la
función de barra invertida (\) cuando se desee identificar una función
en mayúsculas.

La siguiente tabla proporciona algunas expresiones de ejemplo y


descripciones de sus interpretaciones mediante el analizador de
dialectos de consulta.

Tabla 2 – Expresiones de ejemplo con descripciones incluidas.

Fórmulas de hoja de cálculo


En OLAP se tienen 5 tipos de cálculos:

1. Agregaciones

Son simplemente sumas. Agregar días a semanas, semanas a meses,


etc., o clientes individuales a grupos de clientes, familias, etc.
2. Cálculos matriciales

Los cálculos matriciales son iguales a los que haría una hoja de
cálculo, con relaciones arbitrariamente complejas (+, -, *, /, suma,
recuento y más) tanto en la fila como en las columnas. Por ejemplo,
cálculos como varianza, porcentaje de varianza, total, recuento, saldos
de inventario, etc.

3. Cálculos multidimensionales

Son iguales a los que harían hojas de cálculo vinculadas o una hoja de
cálculo multidimensional. En estos, los resultados calculados pueden
referirse a números en otra hoja del cubo, sobre dimensiones de
distinción o jerarquías diferentes, no solo en la misma hoja de cálculo
en la que se encuentra. Los ejemplos de cálculo incluyen participación
de producto, participación de mercado, etc.

4. Funciones compatibles con OLAP

Son iguales a funciones de hoja de cálculo que se han ampliado para


comprender OLAP. Estos abarcan estadísticas, propósitos de
pronóstico, propósitos económicos, cálculos de tiempo. Al igual que
una hoja de cálculo, la mayoría de los servidores OLAP tienen cientos
de fórmulas compatibles con OLAP.

Ejemplo: con una sola función compatible con OLAP se podría evaluar
una desviación de referencia, una variación, una tasa de interés, etc.
en todas las dimensiones.

Más allá de lo que hace una hoja de cálculo, estos propósitos


funcionan en todas las dimensiones y puede entender conceptos
OLAP como padres, niños pequeños, antepasados, inteligencia de
tiempo, etc.

5. Cálculos procedimentales

Son aquellos en los que se definen y ejecutan reglas de cálculo


específicas en un orden específico. Por ejemplo, un porcentaje de la
contribución a los ingresos es un cálculo de procedimiento. El análisis
de rentabilidad también es un ejemplo de cálculo procedimental.
Requiere lógica de procedimiento para modelar y ejecutar reglas que
reflejen el negocio.

 
Velocidad de los servicios de análisis
OLAP ofrece la forma más simple de análisis, lo que permite a
cualquier persona cortar subconjuntos interrelacionados de datos o
"cubos" con el clic de un mouse. Los usuarios pueden investigar datos
utilizando características OLAP estándar como paginación, pivotar,
ordenar, filtrar y desglosar hacia arriba y hacia abajo para hojear una
secuencia de vistas de informes.

El análisis OLAP ofrece a los usuarios acceso principal a sus bodegas


de datos en lugar de una funcionalidad de investigación más
sofisticada que necesitan los usuarios avanzados y los analistas.

La mayoría de los proveedores de OLAP ofrecen soluciones OLAP


multidimensionales (MOLAP) para realizar este tipo de análisis, pero la
capacidad de cubo restringida ha causado grandes problemas a
numerosos administradores de TI al establecer y organizar cientos de
bases de datos de cubos superpuestos para mantener el ritmo con las
crecientes demandas de la organización. Sin embargo, para
aprovechar al máximo las aplicaciones de BI, la investigación de
OLAP desea continuar más allá del cubo MOLAP de referencia y
proporcionar una interactividad de máxima velocidad de pensamiento
en toda la bodega de datos.

Analysis Services lleva OLAP al permitirle diseñar, crear y administrar


organizaciones multidimensionales que contienen datos agregados de
otras fuentes de datos, como bases de datos relacionales. Para las
aplicaciones de minería de datos, Analysis Services permite diseñar,
crear y visualizar modelos de minería de datos que se ensamblan a
partir de otras fuentes de datos mediante el uso de un amplio tipo de
algoritmos de excavación de datos estándar de la industria. La fig. 7
muestra el análisis de conceptos y objetos de servicios.
Fig. 7 – Análisis de conceptos y objetos de servicios.

 
Bibliografía
 Pérez Marqués, María (2015), Business Intelligence: Técnicas,
herramientas y aplicaciones (1ª Ed.), México D.F., México,
Alfaomega.
 Cano, Josep Lluís (2007), Business Intelligence: Competir con
Información, Barcelona, España, ESADE Business School.
 Vercellis, Carlo (2009), Business Intelligence: Data Mining and
Optimization for Decision Making, Politecnico di Milano, Italy,
John Wiley & Sons, Ltd.
 Loshin, David (2003), Business Intelligence – The Savvy
Manager's Guide, San Francisco, USA, Morgan Kaufmann
Publishers.

Historia de la Inteligencia de Negocios


Normalmente, las primeras aplicaciones comerciales tenían sus
propias bases de datos que respaldaban sus funciones, las cuales se
convirtieron en "islas de información" en las que ningún otro sistema
tuvo acceso a ellas. Para empeorar el problema, estas islas de
información proliferaron a medida que se automatizaban más y más
departamentos.

Adicionalmente, las fusiones y adquisiciones entre empresas


empeoraron el problema, ya que las empresas utilizaban sistemas
completamente distintos, y sin embargo muchos de ellos estaban
haciendo un trabajo similar.

A pesar de las dificultades, las empresas identificaron en poco tiempo


el valor analítico de los datos a los que tenían acceso. De hecho, a
medida que las empresas automatizaban más sistemas, se podía
acceder a más datos. Sin embargo, la recopilación de estos datos
para su análisis fue un desafío debido a las incompatibilidades entre
los sistemas, ya que no había una forma sencilla (y a menudo
ninguna) para que estos sistemas interactuaran.

Para superar esta realidad se necesitaba una infraestructura para el


intercambio, la recopilación y el análisis de datos que pudiera
proporcionar una vista unificada de los datos de una empresa, por lo
que el almacén de datos evolucionó para atender esta necesidad.

Data Warehouse (Almacén de Datos o Bodega de


Datos)
El concepto de data warehouse  (ver fig. 1) es un esquema solitario
[1]

que representa el repositorio de todos los datos de la organización (o


simplemente datos) en un patrón que se puede analizar de manera
competente para que las cuentas importantes se puedan organizar
para ser consultadas por la administración y por otros trabajadores de
la información.
Fig. 1 – Concepto de data warehouse.

 
Sin embargo, alcanzar este objetivo requiere algunos desafíos:

 Los datos deben obtenerse de una variedad de sistemas


incompatibles.
 La misma pieza de datos puede residir en las bases de datos de
varios sistemas y en distintos tipos. Es posible que un elemento
de datos específico no solo se represente en formatos distintos,
sino que los valores de este elemento de datos pueden ser
distintos en bases de datos distintas, por lo que se dificulta
identificar cuál valor es el correcto.
 Los datos se modifican continuamente, por lo que es difícil
determinar con qué frecuencia se debe revisar el almacén de
datos para contemplar una vista razonablemente actual.
 La cantidad de datos es enorme, por lo que se vuelve difícil de
analizar y presentar fácilmente para que sea útil.

Para satisfacer estas necesidades, se desarrolló una amplia gama de


herramientas poderosas a lo largo de los años que se volvieron
productivas. Ellas incluyeron:

 Utilidades de extracción, transformación y carga (ETL) para


mover datos desde las diversas fuentes de datos al almacén de
datos común.
 La minería de datos impulsa el análisis predeterminado complejo
y las consultas ad hoc de los datos contenidos en el almacén de
datos.
 Herramientas de informes para proporcionar a la gerencia los
resultados del análisis en formatos muy simples de entender.

 
Extracción, transformación y carga sin conexión
(ETL)
Al principio, la única interfaz común que se proporcionaba entre los
distintos sistemas en una organización era la cinta magnética. Los
formatos de cinta estaban estandarizados y cualquier sistema podía
generar cintas que pudieran ser leídas por otros sistemas. Así, los
primeros almacenes de datos fueron alimentados por cintas
magnéticas preparadas por los distintos sistemas dentro de la
organización. Sin embargo, eso dejó la dificultad de la disparidad de
datos. Los datos escritos por los diferentes sistemas reflejan sus
asociaciones de datos nativas.

Los datos escritos en cinta por un sistema a menudo tenían poca


relación con los datos similares escritos por otro sistema.

Aún más importante fue que la base de datos del almacén de datos se
diseñó para respaldar las funciones analíticas necesarias para la
función de inteligencia de negocios. Este diseño de base de datos era
típicamente una base de datos altamente organizada con índices
complejos para respaldar el procesamiento analítico en línea (OLAP . [2]

Las bases de datos configuradas para OLAP permitieron consultas


complejas analíticas y ad hoc con un tiempo de ejecución rápido. Los
datos enviados al almacén de datos desde los sistemas empresariales
se convirtieron a un formato significativo para el almacén de datos.

Para resolver la dificultad de agregar inicialmente estos datos en un


almacén de datos, mantenerlos actualizados y resolver discrepancias,
se desarrollaron las utilidades Extraer, Transformar y Cargar (ETL .
[3]

Como sugiere su nombre, estas utilidades extraen datos de las bases


de datos de origen, los cambian/transforman al formato de
almacenamiento de datos generalizado y los cargan en el
almacenamiento de datos, como se muestra en la fig. 2.
Fig. 2– Estructura de extracción, transformación y carga.

La función de transformación es la clave para el logro de este enfoque,


y su trabajo es definir una serie de reglas que permita extraer los
datos y que tengan el formato adecuado para cargarlos en el almacén
de datos.

Un ejemplo de reglas de transformación incluye:

 La selección de datos para cargar.


 La traducción de elementos codificados (por ejemplo, 1 para
hombre o M, 2 para mujer o F).
 Derivación de nuevos valores calculados (precio de oferta =
precio – descuento).
 Fusionando datos de múltiples fuentes.
 Resumir (agregar) ciertas filas y columnas.
 Dividir una columna en varias columnas.
 Resolución de discrepancias entre elementos de datos similares.
 Validando los datos.

La fig. 3 muestra la representación del modelo ETL.

Fig. 3 – Representación del modelo ETL.

La función ETL permite la consolidación de múltiples fuentes de datos


en una base de datos bien estructurada para su uso en análisis
complejos. El proceso ETL se realiza ocasionalmente, como diario,
semanal o mensual, según las necesidades de la empresa. Este
método se denomina ETL sin conexión porque la base de datos de
claves no se actualiza constantemente, sino que se revisa
periódicamente por lotes. Aunque ETL sin conexión cumple bien su
propósito, también tiene algunos inconvenientes:
 Los datos del almacén de datos no están actualizados. Podría
tener semanas. Sin embargo, es útil para funciones estratégicas
pero no es especialmente adaptable al uso táctico.
 Por lo general, la base de datos de origen debe estar inactiva
temporalmente durante todo el método de extracción. De lo
contrario, la base de datos de destino se encuentra en un estado
incoherente después de la carga. Con este resultado, las
aplicaciones deben cerrarse, a menudo durante horas.

Para que el desarrollo sea compatible con la inteligencia de negocios


en tiempo real, la función ETL debe ser implacable y no invasiva, lo
que se denomina ETL en línea y se describe más adelante. En
comparación con el ETL fuera de línea, que proporciona datos que no
son respuestas recientes pero confiables a las consultas, el ETL en
línea proporciona respuestas presentes pero variables a consultas
sucesivas, ya que los datos que utiliza se actualizan constantemente
para reflejar el estado actual de la empresa.

Motores de minería de datos


Las utilidades ETL hacen que la recopilación de datos de numerosos
sistemas diversos sea práctica. Luego, los datos deben convertirse en
información útil. Algunos puntos clave para recordar:

 Los datos son fácilmente hechos, cifras y texto que pueden ser
procesados por una computadora. Por ejemplo, una transacción
en un punto de venta minorista son datos.
 La información son datos procesados. Por ejemplo, el análisis
de las transacciones en el punto de venta proporciona
información sobre el comportamiento de compra del consumidor.
 El conocimiento representa un patrón que conecta la
información y generalmente presenta un alto grado de
previsibilidad en cuanto a lo que se cuenta o lo que sucederá a
continuación. Un ejemplo de conocimiento es la predicción de
los esfuerzos promocionales sobre las ventas de artículos
particulares en función del comportamiento de compra de los
compradores.

Se desarrollaron motores de minería de datos  útiles para realizar


[4]

análisis complejos y consultas ad hoc en la base de datos de un


almacén de datos. La minería de datos busca patrones entre cientos
de campos aparentemente no relacionados en una gran base de
datos, con capacidad para reconocer tendencias desconocidas
anteriores, las cuales juegan un papel clave en la toma de decisiones
estratégicas porque revelan puntos para la mejora del proceso.

Por ejemplo, algunos motores de minería de datos son SPSS y


Oracle, que forman la base de los sistemas OLAP (procesamiento
analítico en línea).

Herramientas de informes
El conocimiento creado por un motor de minería de datos no es muy
útil a menos que se presente fácil y claramente a quienes lo necesitan.
Hay muchos formatos para reportar información y resultados de
conocimiento. Una de las técnicas comunes para mostrar información
es el tablero digital (ver fig. 4).

Fig. 4 – Tablero digital.

Un tablero digital proporciona al gerente de negocios la información


necesaria para impulsar el negocio hacia el éxito. Presenta al cliente
una vista gráfica de los procesos comerciales. Luego, el cliente
desglosa los datos a voluntad para obtener más detalles sobre un
proceso específico. Hoy en día, se puede acceder a muchas versiones
de paneles de control digitales a través de una especie de
proveedores de software.
 

Data marts
A medida que se empezaron a utilizar los almacenes de datos de toda
la empresa, se descubrió que en muchas situaciones un almacén de
datos completo era excesivo para las aplicaciones. Los mercados de
datos evolucionaron para resolver este problema. Un data mart es un
tipo especial de data warehouse. Se centra en un solo tema (o área
funcional), como Ventas, Finanzas o Mercadeo. Mientras que los
almacenes de datos tienen una profundidad en toda la empresa, la
información en los data marts pertenece a un solo departamento. El
uso principal de una despensa de datos son las aplicaciones de
Business Intelligence (BI). Implementar un data mart puede ser menos
costoso que implementar un data warehouse, lo que lo hace más
práctico para las pequeñas empresas.

Un data mart también se puede configurar en mucho menos tiempo


que un data warehouse.

La figura 5 muestra la relación entre el almacén de datos y la


despensa de datos.

Fig. 5 – Relación entre data warehouse y data mart.

Propósito de los sistemas de inteligencia de


negocios
"El propósito de los sistemas de inteligencia de negocios es utilizar
todos los datos de negocios subyacentes para ayudar a los ejecutivos
a tomar mejores decisiones de negocios", afirmó Tony Banham,
director de tecnología y soluciones de Oracle Greater China.

El proceso de Inteligencia de Negocios consta de 3 tareas distintas:

1. La primera tarea que debe realizar BI es recopilar los datos


necesarios sobre el negocio. La clave para esto es automatizar
el proceso. La recopilación de datos consumía mucho tiempo y
dinero en el pasado, pero hoy en día, con el uso de
computadoras modernas, es mucho más fácil recopilar datos de
varias fuentes.
2. La segunda tarea es analizar los datos recopilados y luego
extraer más información de ellos. La información extraída luego
se transforma en conocimiento.
3. La tarea final es utilizar el conocimiento recién adquirido para
mejorar el negocio.

Existen muchas herramientas de inteligencia de negocios para


completar el proceso de recopilación de conocimientos relacionados
con los negocios como Sisense, Data Pine, Tableau, Domo, IBM
Cognos Analytics, QlikSense, Microsoft Power BI, Oracle BI o Clear
Analytics .
[5]

Estructura de los sistemas de inteligencia


Un sistema de inteligencia de negocios tiene tres ventajas clave:

1. No solo es compatible con las últimas tecnologías de la


información, sino que también proporciona soluciones de
aplicaciones pre-empaquetadas.
2. Se centra en el acceso y la entrega de información comercial a
los usuarios finales, y brinda apoyo tanto a los proveedores de
información como a los consumidores de información.
3. Admite el acceso a todas las formas de información comercial, y
no solo a la información almacenada en un almacén de datos.

Aplicaciones de inteligencia de negocios


Las aplicaciones de inteligencia de negocios proporcionan
aplicaciones empresariales integradas, hardware, software y servicios
de consultoría. Decision Edge de IBM, por ejemplo, analiza la
información del cliente y en base a eso ayuda en la creación de
programas de mercadeo personalizados para el cliente.

La fig. 6 ofrece una descripción general de la estructura del sistema


inteligente de negocios.

Fig. 6 – Conjunto de productos de Inteligencia de Negocios de


IBM.

Herramientas de apoyo a la toma de decisiones


 Consulta e informes: los dos productos principales de consulta
e informes (en IBM) son Query Management Facility (QMF) y el
enfoque de Lotus. QMF se ha utilizado durante muchos años
como una herramienta de consulta e informes basada en host
por DB2, mientras que el enfoque de Lotus es un DBMS
relacional de escritorio que ha ganado popularidad debido a sus
capacidades de consulta e informes fáciles de usar.
 Procesamiento analítico en línea (OLAP): si se habla de la
estructura de IBM, su producto clave en el mercado OLAP es el
DB2 OLAP Server, que implementa una arquitectura
cliente/servidor de tres niveles para realizar análisis de datos
complejos. El valor del servidor DB2 OLAP radica en su
capacidad para generar y administrar tablas relacionales que
contienen datos multidimensionales.
 Minería de información: Intelligent Miner de IBM es uno de los
pocos productos en el mercado que admite una API externa, lo
que permite que otros productos (por ejemplo, un producto
OLAP) recopilen los datos resultantes para su posterior análisis.
 Facilitadores de acceso: el acceso del cliente a los datos
operativos y del almacén de las herramientas de inteligencia de
negocios requiere una API de base de datos del cliente.
 Gestión de datos: la gestión de datos ofrece partición
inteligente de datos, procesamiento de datos y consultas en
paralelo. Ejemplo: DB2 para OS/390, DB2 para VM y DB2 para
VSE DB2 Universal Database.
 Modelado de almacén de datos: con Visual Warehouse se
puede diseñar y construir un almacén de datos. Las
herramientas para desarrollar el almacén de datos incluyen
componentes para definir las relaciones entre los datos de
origen y la información del almacén, transformar los datos de
origen y administrar el mantenimiento del almacén.

Arquitecturas de inteligencia de negocios

La arquitectura de un sistema de inteligencia de negocios, que se


muestra en la fig. 7, incluye tres componentes principales.
Fig. 7 – Una arquitectura típica de inteligencia de negocios.

Fuentes de datos. En una primera etapa, es necesario recopilar e


integrar los datos almacenados en las distintas fuentes primarias y
secundarias, que son heterogéneas en origen y tipo. Las fuentes
consisten en su mayor parte en datos pertenecientes a sistemas
operativos, pero también pueden incluir documentos no estructurados,
como correos electrónicos y datos recibidos de proveedores externos.
En general, se requiere un gran esfuerzo para unificar e integrar las
diferentes fuentes de datos.

Data warehouses y data marts. Utilizando herramientas de


extracción y transformación conocidas como extraer, transformar,
cargar (ETL), los datos que se originan en las diferentes fuentes se
almacenan en bases de datos destinadas a respaldar los análisis de
inteligencia de negocios. Estas bases de datos generalmente se
conocen como data warehouses y data marts.

Metodologías de inteligencia de negocios. Finalmente, los datos se


extraen y se utilizan para alimentar modelos matemáticos y
metodologías de análisis destinadas a ayudar a los tomadores de
decisiones. En un sistema de inteligencia de negocios se pueden
implementar varias aplicaciones de apoyo a la toma de decisiones:

 Análisis de cubos multidimensionales.


 Análisis exploratorio de datos.
 Análisis de series temporales.
 Modelos de aprendizaje inductivo para la minería de datos.
 Modelos de optimización.
La pirámide de la fig. 8 muestra los componentes básicos de un
sistema de inteligencia de negocios. Hasta ahora, se han visto los
componentes de los dos primeros niveles cuando se analiza la fig. 7.
Ahora se presenta la descripción de los niveles superiores.

Fig. 8 – Componentes principales de un sistema de inteligencia


de negocios.

Exploración de datos. En el tercer nivel de la pirámide encontramos


las herramientas para realizar un análisis pasivo de inteligencia de
negocios, que consta de sistemas de consulta y reporte, así como
métodos estadísticos. Estas se conocen como metodologías pasivas
porque se solicita a los tomadores de decisiones que generen
hipótesis previas o definan criterios de extracción de datos, y luego
utilicen las herramientas de análisis para encontrar respuestas y
confirmar su conocimiento original. Por ejemplo, considere el gerente
de ventas de una empresa que se da cuenta de que los ingresos en
un área geográfica determinada han disminuido para un grupo
específico de clientes. Por lo tanto, es posible que desee confirmar su
hipótesis mediante el uso de herramientas de extracción y
visualización, y luego aplicar una prueba estadística para verificar que
sus conclusiones estén adecuadamente respaldadas por datos.
Procesamiento de datos. El cuarto nivel incluye metodologías activas
de inteligencia de negocios, cuya finalidad es la extracción de
información y conocimiento de los datos. Estos incluyen modelos
matemáticos para el reconocimiento de patrones, el aprendizaje
automático y las técnicas de minería de datos. A diferencia de las
herramientas descritas en el nivel anterior de la pirámide, los modelos
de tipo activo no requieren que los tomadores de decisiones formulen
ninguna hipótesis previa para ser posteriormente verificada. En
cambio, su propósito es expandir el conocimiento de los tomadores de
decisiones.

Mejoramiento. Al subir un nivel en la pirámide, se encuentran


modelos de optimización que permiten determinar la mejor solución a
partir de un conjunto de acciones alternativas, que suele ser bastante
extenso y, a veces, incluso infinito.

Decisiones. Finalmente, la cima de la pirámide corresponde a la


elección y la adopción real de una decisión específica, y de alguna
manera representa la conclusión natural del proceso de toma de
decisiones. Incluso cuando las metodologías de inteligencia de
negocios están disponibles y se han adoptado con éxito, la elección de
una decisión corresponde a los tomadores de decisiones, quienes
también pueden aprovechar la información informal y no estructurada
disponible para adaptar y modificar las recomendaciones y las
conclusiones obtenidas mediante el uso de modelos matemáticos.

A medida que avanzamos de la base a la cima de la pirámide, los


sistemas de inteligencia de negocios ofrecen herramientas de soporte
cada vez más avanzadas de tipo activo. Incluso los roles y las
competencias cambian. En la parte inferior, las competencias
requeridas son proporcionadas en su mayor parte por los especialistas
en sistemas de información dentro de la organización, generalmente
denominados administradores de bases de datos. Analistas y expertos
en modelos matemáticos y estadísticos son los responsables de las
fases intermedias. Finalmente, las actividades de los tomadores de
decisiones responsables del dominio de la aplicación parecen
dominantes en la parte superior.

Como se describió anteriormente, los sistemas de inteligencia de


negocios abordan las necesidades de diferentes tipos de
organizaciones complejas, incluidas las agencias de la administración
pública y las asociaciones. Sin embargo, si se restringe la atención a
las empresas, las metodologías de inteligencia de negocios se pueden
encontrar principalmente en tres departamentos de una empresa,
como se muestra en la fig. 9: mercadeo y ventas; logística y
producción; contabilidad y control.

Fig. 9 – Departamentos de una empresa que se ocupan de los


sistemas de inteligencia de negocios.

Ciclo de un análisis de inteligencia de negocios


Cada análisis de inteligencia de negocios sigue su propio camino de
acuerdo con el dominio de la aplicación, la actitud personal de los
tomadores de decisiones y las metodologías analíticas disponibles.
Sin embargo, es posible identificar una ruta cíclica ideal que
caracteriza la evolución de un análisis de inteligencia de negocios
típico, como se muestra en la fig. 10, aunque todavía existen
diferencias basadas en la peculiaridad de cada contexto específico.
Fig. 10 – Ciclo de un análisis de inteligencia de negocios.

 
Análisis. Durante la fase de análisis, es necesario reconocer y
explicar con precisión el problema en cuestión. Los tomadores de
decisiones deben entonces crear una representación mental del
fenómeno que se analiza, identificando los factores críticos que se
perciben como los más relevantes. La disponibilidad de metodologías
de inteligencia de negocios puede ayudar ya en esta etapa, al permitir
que los tomadores de decisiones desarrollen rápidamente varias vías
de investigación. Por ejemplo, la exploración de cubos de datos en un
análisis multidimensional, de acuerdo con diferentes visiones lógicas,
permite a los tomadores de decisiones modificar sus hipótesis de
manera flexible y rápida, hasta llegar a un esquema de interpretación
que consideren satisfactorio. Así, la primera fase del ciclo de la
inteligencia de negocios lleva a los responsables de la toma de
decisiones a plantear varias preguntas y obtener respuestas rápidas
de forma interactiva.

Conocimiento. La segunda fase permite a los tomadores de


decisiones comprender mejor y más profundamente el problema en
cuestión, a menudo a un nivel causal. Por ejemplo, si el análisis
realizado en la primera fase muestra que un gran número de clientes
están descontinuando una póliza de seguro al vencimiento anual, en la
segunda fase será necesario identificar el perfil y las características
compartidas por dichos clientes. La información obtenida a través de
la fase de análisis se transforma luego en conocimiento. Por un lado,
la extracción de conocimiento puede ocurrir debido a la intuición de los
tomadores de decisiones y por lo tanto basarse en su experiencia y
posiblemente en información no estructurada a su disposición. Por
otro lado, los modelos de aprendizaje inductivo también pueden
resultar muy útiles durante esta etapa de análisis, particularmente
cuando se aplican a datos estructurados.

Decisión. Durante la tercera fase, el conocimiento obtenido como


resultado de la segunda fase se convierte en decisiones y
posteriormente en acciones. La disponibilidad de metodologías de
inteligencia de negocios permite que las fases de análisis y
conocimiento se ejecuten más rápidamente para que se puedan tomar
decisiones más efectivas y oportunas que se adapten mejor a las
prioridades estratégicas de una organización determinada. Esto
conduce a una reducción global del tiempo de ejecución del ciclo
análisis-decisión-acción-revisión y, por tanto, a un proceso de toma de
decisiones de mejor calidad.

Evaluación. Finalmente, la cuarta fase del ciclo de inteligencia de


negocios implica la medición y evaluación del desempeño. Luego, se
deben diseñar métricas extensas que no se limiten exclusivamente a
los aspectos financieros, sino que también tengan en cuenta los
principales indicadores de desempeño definidos para los diferentes
departamentos de la empresa.
 
Factores habilitantes en proyectos de
inteligencia de negocios
Algunos factores son más críticos que otros para el éxito de un
proyecto de inteligencia de negocios: tecnologías, análisis y recursos
humanos.

Tecnologías. Las tecnologías de hardware y software son factores


habilitantes importantes que han facilitado el desarrollo de sistemas de
inteligencia de negocios dentro de empresas y organizaciones
complejas. Por un lado, las capacidades informáticas de los
microprocesadores han aumentado en promedio un 100% cada 18
meses durante las últimas dos décadas y los precios han bajado. Esta
tendencia ha permitido el uso de algoritmos avanzados que son
necesarios para emplear métodos de aprendizaje inductivo y modelos
de optimización, manteniendo los tiempos de procesamiento dentro de
un rango razonable. Además, permite la adopción de técnicas de
visualización gráfica de última generación, con animaciones en tiempo
real. Otro factor habilitador relevante se deriva del aumento
exponencial de la capacidad de los dispositivos de almacenamiento
masivo, nuevamente a costos decrecientes, lo que permite a cualquier
organización almacenar terabytes de datos para sistemas de
inteligencia de negocios. Y la conectividad de red, en forma de
Extranets o Intranets, ha jugado un papel primordial en la difusión
dentro de las organizaciones de información y conocimiento extraídos
de los sistemas de inteligencia de negocios. Finalmente, la fácil
integración de hardware y software comprados por diferentes
proveedores, o desarrollados internamente por una organización, es
otro factor relevante que afecta la difusión de las herramientas de
análisis de datos.

Analítica. Como se indicó anteriormente, los modelos matemáticos y


las metodologías analíticas desempeñan un papel clave en la mejora
de la información y la extracción de conocimientos de los datos
disponibles dentro de la mayoría de las organizaciones. La mera
visualización de los datos de acuerdo con visiones lógicas oportunas y
flexibles juega un papel relevante para facilitar el proceso de toma de
decisiones, pero aún representa una forma pasiva de apoyo. Por
tanto, es necesario aplicar modelos más avanzados de aprendizaje
inductivo y optimización para lograr formas activas de apoyo al
proceso de toma de decisiones.

Recursos humanos. Los activos humanos de una organización se


construyen mediante las competencias de quienes operan dentro de
sus límites, ya sea como individuos o colectivamente. El conocimiento
general que poseen y comparten estos individuos constituye la cultura
organizacional. La capacidad de los trabajadores del conocimiento
para adquirir información y luego traducirla en acciones prácticas es
uno de los principales activos de cualquier organización y tiene un
gran impacto en la calidad del proceso de toma de decisiones. Si una
empresa determinada ha implementado un sistema de inteligencia de
negocios avanzado, todavía queda mucho margen para enfatizar las
habilidades personales de sus trabajadores del conocimiento, quienes
deben realizar los análisis e interpretar los resultados, para elaborar
soluciones creativas y diseñar planes de acción efectivos. Siendo
iguales todas las herramientas analíticas disponibles, una empresa
que emplee recursos humanos, dotada de una mayor agilidad mental
y dispuesta a aceptar cambios en el estilo de toma de decisiones,
tendrá una ventaja sobre sus competidores.

Desarrollo de un sistema de inteligencia de


negocios
El desarrollo de un sistema de inteligencia de negocios puede
asimilarse a un proyecto, con un objetivo final específico, tiempos y
costos de desarrollo esperados, y el uso y coordinación de los
recursos necesarios para realizar las actividades planificadas. La fig.
11 muestra el ciclo de desarrollo típico de una arquitectura de
inteligencia de negocios. Evidentemente, el camino específico seguido
por cada organización puede diferir del descrito en la figura. Por
ejemplo, si las estructuras de información básica, incluidos el almacén
de datos y los mercados de datos, ya están en su lugar, las fases
correspondientes indicadas en la fig. 11 no serán necesarias.

Fig. 11 – Fases del desarrollo de un sistema de inteligencia de


negocios.
 
Análisis. Durante la primera fase, se deben identificar
cuidadosamente las necesidades de la organización en relación con el
desarrollo de un sistema de inteligencia de negocios. Esta fase
preliminar generalmente se lleva a cabo a través de una serie de
entrevistas a trabajadores del conocimiento que desempeñan
diferentes roles y actividades dentro de la organización. Es necesario
describir claramente los objetivos y prioridades generales del proyecto,
así como exponer los costos y beneficios derivados del desarrollo del
sistema de inteligencia de negocios.

Diseño. La segunda fase incluye dos sub-fases y tiene como objetivo


derivar un plan provisional de la arquitectura global, teniendo en
cuenta cualquier desarrollo en un futuro próximo y la evolución del
sistema a medio plazo. En primer lugar, es necesario realizar una
valoración de las infraestructuras de información existentes. Además,
se deben examinar los principales procesos de toma de decisiones
que deben ser respaldados por el sistema de inteligencia de negocios,
con el fin de determinar adecuadamente los requisitos de información.
Posteriormente, utilizando metodologías clásicas de gestión de
proyectos, se establecerá el plan del proyecto, identificando fases de
desarrollo, prioridades, tiempos y costos de ejecución esperados, así
como los roles y recursos requeridos.

Planificación. La etapa de planificación incluye una sub-fase donde


se definen y describen con mayor detalle las funciones del sistema de
inteligencia de negocios. Posteriormente, se evalúan los datos
existentes, así como otros datos que podrían recuperarse
externamente. Esto permite diseñar las estructuras de información de
la arquitectura de inteligencia de negocios, que consisten en un
almacén de datos central y posiblemente algunos mercados de datos
satelitales. Simultáneamente con el reconocimiento de los datos
disponibles, se deben definir los modelos matemáticos a adoptar,
asegurando la disponibilidad de los datos requeridos para alimentar
cada modelo y verificando que la eficiencia de los algoritmos a utilizar
sea la adecuada a la magnitud de los problemas resultantes. Por
último, conviene crear un prototipo de sistema, a bajo costo y con
capacidades limitadas, para descubrir de antemano cualquier
discrepancia entre las necesidades reales y las especificaciones del
proyecto.

Implementación y control. La última fase consta de cinco sub-fases


principales. Primero, se desarrollan el almacén de datos y cada
despensa de datos específico. Estos representan las infraestructuras
de información que alimentarán el sistema de inteligencia de negocios.
Para explicar el significado de los datos contenidos en el almacén de
datos y las transformaciones aplicadas previamente a los datos
primarios, se debe crear un archivo de metadatos. Además, se
establecen procedimientos ETL para extraer y transformar los datos
existentes en las fuentes primarias, cargándolos en data warehouse y
en los datamarts. El siguiente paso está dirigido al desarrollo de las
aplicaciones fundamentales de la inteligencia de negocios que
permitan realizar los análisis previstos. Finalmente, el sistema está
disponible para prueba y uso.

La fig. 12 proporciona una descripción general de las principales


metodologías que pueden incluirse en un sistema de inteligencia de
negocios. Algunos de ellos tienen una naturaleza metodológica y se
pueden usar en diferentes dominios de aplicación, mientras que otros
solo se pueden aplicar a tareas específicas.

Fig. 12 – Portafolio de metodologías disponibles en un sistema de


inteligencia de negocios.
 
Ética e inteligencia de negocios
La adopción de metodologías de inteligencia de negocios, métodos de
minería de datos y sistemas de apoyo a la toma de decisiones plantea
algunos problemas éticos que no deben pasarse por alto. En efecto, el
avance hacia la sociedad de la información y el conocimiento abre
innumerables oportunidades, pero también puede generar distorsiones
y riesgos que deben prevenirse y evitarse mediante el uso de reglas y
mecanismos de control adecuados. No se debe tolerar el uso de datos
por parte de organizaciones públicas y privadas que sea inadecuado y
no respete el derecho a la privacidad de las personas. De manera más
general, debemos protegernos contra el crecimiento excesivo del
poder político y económico de las empresas que permiten que los
procesos de transformación descritos anteriormente beneficien
exclusiva y unilateralmente a dichas empresas, a expensas de los
consumidores, trabajadores y habitantes del ecosistema terrestre.

Sin embargo, incluso en ausencia de regulaciones específicas que


evitarían el abuso de la recopilación de datos y las investigaciones
invasivas, es esencial que los analistas de inteligencia de negocios y
los tomadores de decisiones cumplan con el principio ético de respeto
de los derechos personales sin excepción. El riesgo de traspasar el
límite entre el uso correcto e intrusivo de la información es
particularmente alto dentro de los campos del mercadeo relacional y la
minería web. Por ejemplo, incluso si se disfraza con nombres
aparentemente inofensivos como 'enriquecimiento de datos', la
información privada en los individuos y los hogares circulan, pero eso
no significa que sea ético que los tomadores de decisiones y las
empresas lo utilicen.

El respeto por el derecho a la privacidad no es la única cuestión ética


relacionada con el uso de sistemas de inteligencia de negocios. En los
últimos años se ha debatido mucho sobre las responsabilidades
sociales de las empresas, lo que ha llevado a la introducción del
nuevo concepto de partes interesadas. Este término se refiere a
cualquier persona que tenga algún interés en las actividades de una
empresa determinada, como inversores, empleados, sindicatos y la
sociedad civil en su conjunto. Existe una diversidad de opiniones
sobre si una empresa debería perseguir la maximización de beneficios
a corto plazo, actuando exclusivamente en interés de los accionistas,
o debería adoptar un enfoque que tenga en cuenta las consecuencias
sociales de sus decisiones.

Los análisis basados en sistemas de inteligencia de negocios se ven


afectados por este tema y por lo tanto corren el riesgo de ser utilizados
para maximizar las ganancias incluso cuando se deben tener en
cuenta diferentes consideraciones relacionados con las consecuencias
sociales de las decisiones tomadas, según una lógica que debería ser
rechazada. Por ejemplo, ¿es correcto desarrollar un modelo de
optimización con el propósito de distribuir los costos a escala
internacional para eludir los sistemas tributarios de ciertos países?
¿Es legítimo tomar una decisión sobre la posición óptima del tanque
en un vehículo para minimizar los costos de producción, incluso si esto
puede causar daños graves a los pasajeros en caso de colisión?
Como lo demuestran estos ejemplos, los analistas que desarrollan un
modelo matemático y quienes toman las decisiones no pueden
permanecer neutrales, sino que tienen la obligación moral de adoptar
una postura ética.

También podría gustarte