Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Acayucan
Inteligencia de negocios
Tarea 1: Inteligencia de Negocios.
Alumno(s)
Aurelio Landa Rivera. 170B0841
En el contexto de la informática, un almacén de datos (data ware house), es una colección de datos
el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se usa para realizar
empresarial. Se trata, sobre todo, de un expediente completo de una organización, mas allá de la
información transaccional y operacional, almacenado en una base de datos diseñada para favorecer
línea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de
datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades
lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea
necesario.
Es importante diferenciar una base de datos “Warehouse” de una base de datos “fuente” puesto que
cada una tiene una función diferente. Las bases de datos fuente están diseñadas para extraer y
almacenar datos, en cambio, un Data Warehouse está diseñado para ejecutar complejos análisis de
De las fuentes de datos es de dónde mana el rio de información. Es por ello que es clave que haya
“calidad de datos”, es decir, que los datos sirvan para el uso que se quiere realizar.
Las fuentes de datos pueden ser de dos tipos dependiendo del origen:
De origen externo a la organización: por ejemplo datos de Redes Sociales o de Fuentes de Datos
Abiertos Gubernamentales (Opendata).
Una vez identificadas todas las fuentes de datos donde extraeremos aquella información que nos
interesa, empezaría el proceso de ETL.
Procesos ETL
Los procesos ETL ejecutan 3 acciones para llevar los datos de un sitio a otro:
Transformar estos datos en un formato homogéneo para que se pueden relacionar unos con otros.
Carga (Load en inglés) de los datos en un Data Warehouse para su posterior análisis.
Data Warehouse
Un Data Warehouse como su nombre indica es un almacén de datos. Pero más allá de esta
definición tan simple encontramos una explicación más compleja. Un Data Warehouse es una base
de datos que se compone de datos agregados de numerosas fuentes de datos que han pasado por un
proceso ETL para integrarse de forma homogénea. La base de datos resultante está diseñada para
organizar y optimizar los datos para posteriores análisis complejos.database-152091_640.png
Online Analytical Processing (OLAP)
Mientras los procesos ETL y Data Warehouse representan el “back end” de un sistema de BI,
el cubo OLAP representa el “front end”. Por ejemplo los procesos ETL y Data Warehouse
serían como la cocina de un restaurante donde se preparan los diferentes platos mientras que un
cubo OLAP seria como el buffet libre de dicho restaurante donde uno puede escoger a demanda
aquello que va a tomar.
Los cubos OLAP son herramientas muy potentes para usuarios avanzados de BI porque da a éstos
la posibilidad de agrupar, agregar y ordenar a su antojo los datos para dar respuesta a preguntas muy
específicas.
Por lo tanto, es una forma de visualizar los datos muy completa que, no obstante, tiene una cierta
complejidad para usuarios que no están familiarizados. En consecuencia, es una herramienta muy
práctica para analistas.
Herramientas de visualización
Las herramientas de visualización suelen ser la parte visible de un sistema de BI para los usuarios
finales. Por eso se acostumbra a sobrevalorar la importancia de ésta cuando realmente no debería de
representar más del 20% de trabajo de desarrollo de un sistema de BI.
Si vamos un paso más allá nos encontraríamos con un “Cuadro de Mandos Integral” que se trata de
una herramienta de gestión bastante completa. Podríamos definir un CMI como un conjunto de
Dashboards que reúnen una serie de indicadores que miden unos objetivos relacionados entre sí, los
cuales están ligados a unos planes de acción que permiten alinear el comportamiento de los
miembros de la organización con la estrategia de la empresa.
Esquema de un almacen de datos (Data Warehouse):