Está en la página 1de 5

Instituto Tecnológico Superior de

Acayucan
Inteligencia de negocios
Tarea 1: Inteligencia de Negocios.

Alumno(s)
Aurelio Landa Rivera. 170B0841

Ingeniería en Informática, 807-C

MTI. Feliciano Sánchez Mendoza

Acayucan, ver., 05 de Abril del 2021


DEFINICION DE DATA WAREHOUSE:

En el contexto de la informática, un almacén de datos (data ware house), es una colección de datos

orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en

el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se usa para realizar

informes (reports) y análisis de datos y se considera un componente fundamental de la inteligencia

empresarial. Se trata, sobre todo, de un expediente completo de una organización, mas allá de la

información transaccional y operacional, almacenado en una base de datos diseñada para favorecer

el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en

línea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de

datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades

lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea

necesario.

Es importante diferenciar una base de datos “Warehouse” de una base de datos “fuente” puesto que

cada una tiene una función diferente. Las bases de datos fuente están diseñadas para extraer y

almacenar datos, en cambio, un Data Warehouse está diseñado para ejecutar complejos análisis de

grandes volúmenes datos históricos que provienen de múltiples fuentes.


Fuentes de datos

De las fuentes de datos es de dónde mana el rio de información. Es por ello que es clave que haya
“calidad de datos”, es decir, que los datos sirvan para el uso que se quiere realizar.

Las fuentes de datos pueden ser de dos tipos dependiendo del origen:

De origen interno de la organización. Dentro de esta clasificación encontramos diferentes tipos de


fuentes:

Sistemas Customer Relationship Managment (CRM)

Sistemas Entreprise Resource Planning (ERP)

Bases de datos o software de Inventario, RRHH, Contabilidad, etc.

De origen externo a la organización: por ejemplo datos de Redes Sociales o de Fuentes de Datos
Abiertos Gubernamentales (Opendata).

Una vez identificadas todas las fuentes de datos donde extraeremos aquella información que nos
interesa, empezaría el proceso de ETL.

Procesos ETL

Los procesos ETL ejecutan 3 acciones para llevar los datos de un sitio a otro:

Extracción de los datos de fuentes internas y/o externas.

Transformar estos datos en un formato homogéneo para que se pueden relacionar unos con otros.

Carga (Load en inglés) de los datos en un Data Warehouse para su posterior análisis.

Data Warehouse

Un Data Warehouse como su nombre indica es un almacén de datos. Pero más allá de esta
definición tan simple encontramos una explicación más compleja. Un Data Warehouse es una base
de datos que se compone de datos agregados de numerosas fuentes de datos que han pasado por un
proceso ETL para integrarse de forma homogénea. La base de datos resultante está diseñada para
organizar y optimizar los datos para posteriores análisis complejos.database-152091_640.png
Online Analytical Processing (OLAP)

Mientras los procesos ETL y Data Warehouse representan el “back end” de un sistema de BI,
el cubo OLAP representa el “front end”. Por ejemplo los procesos ETL y Data Warehouse
serían como la cocina de un restaurante donde se preparan los diferentes platos mientras que un
cubo OLAP seria como el buffet libre de dicho restaurante donde uno puede escoger a demanda
aquello que va a tomar.

Los cubos OLAP son herramientas muy potentes para usuarios avanzados de BI porque da a éstos
la posibilidad de agrupar, agregar y ordenar a su antojo los datos para dar respuesta a preguntas muy
específicas.

Por lo tanto, es una forma de visualizar los datos muy completa que, no obstante, tiene una cierta
complejidad para usuarios que no están familiarizados. En consecuencia, es una herramienta muy
práctica para analistas.

Herramientas de visualización

Las herramientas de visualización suelen ser la parte visible de un sistema de BI para los usuarios
finales. Por eso se acostumbra a sobrevalorar la importancia de ésta cuando realmente no debería de
representar más del 20% de trabajo de desarrollo de un sistema de BI.

Se suelen agrupar y relacionar gráficos de diferentes statistic-1564428__180tipos, mapas


interactivos e indicadores de rendimiento (KPIs) en una hoja a la que se llama Cuadro de Mando o
Dashboard. El diseño de los Dashboards dependerá de la información que se quiera transmitir y al
público al que va dirigido. Siempre acostumbra a ser un resumen de los indicadores más relevantes
para el usuario. Una vez expuestos, el usuario puede ir abriendo pantallas para profundizar más en
la información recogida en el “Dashboard Madre”.

Si vamos un paso más allá nos encontraríamos con un “Cuadro de Mandos Integral” que se trata de
una herramienta de gestión bastante completa. Podríamos definir un CMI como un conjunto de
Dashboards que reúnen una serie de indicadores que miden unos objetivos relacionados entre sí, los
cuales están ligados a unos planes de acción que permiten alinear el comportamiento de los
miembros de la organización con la estrategia de la empresa.
Esquema de un almacen de datos (Data Warehouse):

Mi Data Warehouse la diseñe con en esquema de estrella ya que es la más


utilizada actualmente por que nos permite un mayor rendimiento, la temática
principal es el conjunto de datos recabados de una empresa con sucursales de
automóviles, llevando a cabo la minería de datos para recabar información y
poder entregar datos para consulta y seguir evolucionando poco a poco.

También podría gustarte