Dia1

1- BBDD relacionales.
El modelo entidad-relación es el más estandarizado tanto en las bbdd productivas como en las analíticas. Por
definición, dichas bases de datos se descompondrían en entidades, cada entidad es una tabla o conjunto de datos
que guarda información de una unidad de negocio (p.e. usuarios, productos, ventas, clientes…) y que en su diseño
mantiene una relación a nivel lógico y/o físico con otra entidad, de esta forma es posible, por ejemplo, vincular los
clientes a los productos que consumen y al dinero que facturan.
2- BBDD no relacionales.
La recogida masiva de los eventos que se registran en una plataforma informática sin necesidad de que estos se
dividan en entidades, ha abierto nuevas posibilidades en cuanto a la cantidad de información que podemos recoger
y en cómo hemos de explotarla.
Uno de los usos más comunes de esta tipo de bbdd es el uso en web donde, en función del perfil de usuario, se le
recomiendan uno u otro producto para su compra.
3- Data Governance.
Los nuevos sistemas de recogida de información exigen un mayor escrúpulo a la hora de garantizar la calidad e
integridad de los mismos, esto ha provocado la aparición de un concepto que, sin ser nuevo, si que toma ahora
nombre y apellidos en la figura del Data Governance (o vigilancia del dato), persona o sistema responsable de la
calidad final de los mismos.
4- Datamart y Datawarehouse.
Datamart, sistema que reúne información de una sola área de negocio sin que necesariamente esta información
haya de estar relacionada con el resto de áreas.
Datawarehouse, conjunto de Datamarts, o espacio analítico donde se combinan los elementos de las distintas
regiones de negocio de la compañía y que, por lo tanto, permite análisis complejos y transversales.
5- ETL (el back end)

ETL (Extract, Transform and Load), proceso a través del cual una herramienta de software nos permite capturar la
información que generan las bases de datos propias de negocio, CRM, o de ERP, etc… de la compañía, para luego
poder transformarla, adaptándola y finalmente cargarla en la bbdd analítica desde donde la explotaremos y
analizaremos.
A través de las ETL’s generaremos las repositorios con la información que queremos explotar: datamarts y
datawarehouses
6- Facts & dimensions (hechos y dimensiones)

Los datamarts y, por extensión, los datawarehouses se conforman de tablas de hechos y dimensiones.
Las primeras registran los valores o indicadores propios del negocio, mientras que las segundas permiten medir
dichos indicadores en función de variables de distribución. Un buen ejemplo de esto sería poder visualizar el
comportamiento de las ventas (facts) durante los meses del año en curso (dimension).
7- Modelado y Reporting (el frontend)

Las herramientas de modelado y reporting (OBIEE, Bussiness Object, Qlick View…) permiten preparar los datos en
dashboards o reports que facilitaran su interpretación, Tablas bi-variadas, indicadores estadísticos, gráficos de
tendencias, etc…Todo lo necesario para que el analista de negocio o el responsable/s del mismo puedan tomar las
mejores decisiones para su negocio.
8- Hablemos un poco de arquitectura e infraestructura. Conceptos básicos

Al pensar la arquitectura y la infraestructura, nos acercamos, al menos metafóricamente, a los cimientos del edificio
que sustentara nuestro proyecto de BI.
La Arquitectura es la estructura física del proyecto, las capas (o bases de datos) por las pasaran los datos desde su
origen hasta su explotación final, así como el workflow y transformaciones que dichos datos sufrirán.
Por infraestructura nos referiremos más a la necesidad tecnológica del proyecto: servidores donde estarán alojados
los datos y tecnología de explotación de los mismos. Un buen dimensionamiento de la infraestructura nos permitirá
no quedarnos cortos en los requerimientos de explotación ni pasarnos, aumentando innecesariamente, los costes en
productos a los que no sacaremos un porcentaje razonable de partido.
9- Clouding. Migrando a la nube

Los sistemas analíticos tradicionales tenían una clara dependencia del hardware físico del que dispusiese la
compañía, la cual tenía que prever de antemano que iba a necesitar, esto dotaba de poca flexibilidad y escalabilidad
al sistema.
La migración de los servers físicos a espacios virtuales en el cloud (las principales compañías de software ya ofrecen
esta posibilidad: Microsoft, Amazon, Google..) elimina esos problemas y genera el entorno ideal para un sistema Big
Data
10- Big Data y Hadoop.

El Big Data, es probablemente el concepto más novedoso y popular del Bussiness Intelligence y en el que centran
actualmente sus esfuerzos un buen número de analistas e ingenieros de datos de las compañías tecnológicas más
punteras.
Tres “V” resumen el éxito del almacenamiento masivo de datos: velocidad, variabilidad y volumen, es decir, grandes
cantidades de datos lo más variados y ricos posibles que puedan ser explotados en tiempo real, o con mínima
latencia.
Hadoop es un framework, uno de los mas populares para explotar Bigdata, que dota de la infraestructura necesaria
a través de una tecnología basada en un sistema de archivos distribuidos en clusters (HDFS) y de numerosas
herramientas para su posterior procesado (Ambari, Sqooq, Hive, Pig…, son solo algunos ejemplos).

Dia1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Dia1

Cargado por

Copyright:

Formatos disponibles

1- BBDD relacionales.

5- ETL (el back end)

6- Facts & dimensions (hechos y dimensiones)

7- Modelado y Reporting (el frontend)

8- Hablemos un poco de arquitectura e infraestructura. Conceptos básicos

9- Clouding. Migrando a la nube

10- Big Data y Hadoop.

También podría gustarte