Está en la página 1de 3

Grupo 2.

Marleydy Paulino 2017-1183. Gary Pimentel 2017-1133

Componentes de BI.
Un sistema de Business Intelligence está compuesto por una serie de
componentes que se relacionan entre sí y que tienen cada uno su función
específica.
Fuentes de datos
De las fuentes de datos es de dónde mana el rio de información. Es por ello que
es clave que haya “calidad de datos”, es decir, que los datos sirvan para el uso
que se quiere realizar.

Las fuentes de datos pueden ser de dos tipos dependiendo del origen:
1. De origen interno de la organización. Dentro de esta clasificación
encontramos diferentes tipos de fuentes:
• Sistemas Customer Relationship Managment (CRM)
• Sistemas Entreprise Resource Planning (ERP)
• Bases de datos o software de Inventario, RRHH, Contabilidad, etc.
2. De origen externo a la organización: por ejemplo, datos de Redes
Sociales o de Fuentes de Datos Abiertos Gubernamentales (Open data).

Una vez identificadas todas las fuentes de datos donde extraeremos aquella
información que nos interesa, empezaría el proceso de ETL.

Procesos ETL

Los procesos ETL ejecutan 3 acciones para llevar los datos de un sitio a otro:

1. Extracción de los datos de fuentes internas y/o externas.


2. Transformar estos datos en un formato homogéneo para que se pueden
relacionar unos con otros.
3. Carga (Load en inglés) de los datos en un Data Warehouse para su
posterior análisis.

Data Warehouse

Un Data Warehouse como su nombre indica es un almacén de datos. Pero más


allá de esta definición tan simple encontramos una explicación más compleja. Un
Data Warehouse es una base de datos que se compone de datos agregados de
numerosas fuentes de datos que han pasado por un proceso ETL para integrarse
de forma homogénea. La base de datos resultante está diseñada para organizar
y optimizar los datos para posteriores análisis complejos.

Es importante diferenciar una base de datos “Warehouse” de una base de datos


“fuente” puesto que cada una tiene una función diferente. Las bases de datos
fuente están diseñadas para extraer y almacenar datos, en cambio, un Data
Grupo 2.
Marleydy Paulino 2017-1183. Gary Pimentel 2017-1133
Warehouse está diseñado para ejecutar complejos análisis de grandes
volúmenes datos históricos que provienen de múltiples fuentes.

Online Analytical Processing (OLAP)

Mientras los procesos ETL y Data Warehouse representan el “back end” de un


sistema de BI, el cubo OLAP representa el “front end”. Es decir, para hacer un
símil tonto, los procesos ETL y Data Warehouse serían como la cocina de un
restaurante donde se preparan los diferentes platos mientras que un cubo OLAP
seria como el buffet libre de dicho restaurante donde uno puede escoger a
demanda aquello que va a tomar.

Los cubos OLAP son herramientas muy potentes para usuarios avanzados de BI
porque da a éstos la posibilidad de agrupar, agregar y ordenar a su antojo los
datos para dar respuesta a preguntas muy específicas.

Por lo tanto, es una forma de visualizar los datos muy completa que, no obstante,
tiene una cierta complejidad para usuarios que no están familiarizados. En
consecuencia, es una herramienta muy práctica para analistas.

Herramientas de visualización

Las herramientas de visualización suelen ser la parte visible de un sistema de BI


para los usuarios finales. Por eso se acostumbra a sobrevalorar la
importancia de ésta cuando realmente no debería de representar más del 20%
de trabajo de desarrollo de un sistema de BI.

Se suelen agrupar y relacionar gráficos de diferentes tipos, mapas interactivos e


indicadores de rendimiento (KPIs) en una hoja a la que se llama Cuadro de
Mando o Dashboard. El diseño de los Dashboards dependerá de la información
que se quiera transmitir y al público al que va dirigido. Siempre acostumbra a ser
un resumen de los indicadores más relevantes para el usuario. Una vez
expuestos, el usuario puede ir abriendo pantallas para profundizar más en la
información recogida en el “Dashboard Madre”.

Data Mining (Minería de Datos).

Es el proceso de análisis de datos. Suele ser una tarea para matemáticos y


estadísticos, pero hay herramientas que facilitan este trabajo a usuarios de
negocios o analistas. Debemos entender que Data Mining es un proceso; no es
simplemente ejecutar un determinado algoritmo que realiza alguna tarea como,
por ejemplo, una regresión lineal o una serie de cálculos y ya está. Este proceso
solamente de cálculo no es Data Mining aunque sí se podamos llegarlo a
entender como un análisis de datos.
Grupo 2.
Marleydy Paulino 2017-1183. Gary Pimentel 2017-1133
Preguntas

1. Un sistema de Business Intelligence no está compuesto por una serie de


componentes que se relacionan entre sí – Falso

2. El Data Mining es el proceso de análisis de datos – Verdadero

3. Un Data Warehouse es un almacén de datos - verdadero

4. Los procesos ETL ejecutan 3 acciones: extraer, transformar y ejecutar –


Falso

5. Los procesos ETL y Data Warehouse representan el “back end” de un


sistema de BI, el cubo OLAP representa el “front end” - Verdadero.

6. Las herramientas de visualización Se suelen agrupar y relacionar


gráficos de diferentes tipos, mapas interactivos e indicadores de
rendimiento (KPIs) en una hoja a la que se llama Cuadro de Mando -
Verdadero.

7. una base de datos Warehouse es lo mismo que una base de datos


“fuente” – Falso

8. Los cubos OLAP no son herramientas muy potentes para usuarios


avanzados de BI porque da a éstos la posibilidad de agrupar, agregar y
ordenar a su antojo los datos para dar respuesta a preguntas muy
específicas - Falso.

9. Las fuentes de datos pueden ser de dos tipos: origen externo y origen
interno – Verdadero

10. Las fuentes de datos pueden ser de seis tipos dependiendo del origen -
Falso.

También podría gustarte