Está en la página 1de 28

Business Intelligence

Objetivos Unidad 3
Tras realizar esta unidad podrás:

Profundizar en los conceptos de ETL y Data Warehouse.


Conocer la importancia de la Tabla de Hechos y los distintos modelos en que puede ser representada, según
las necesidades de la empresa y las características de los datos.
Realizar ejercicios prácticos a través del taller perteneciente a esta unidad, donde podrá crear y administrar
una base de datos.
Business Intelligence

¿Qué son las Fuentes de Datos y ETL?


¿Imaginas un mundo sin acceso a la información? Sería retroceder miles de años en la humanidad. Por eso la
información es fundamental en estos días, para continuar evolucionando y facilitando el trabajo y la vida. De eso
se trata el Business Intelligence, y por ello es tan importante en una empresa. Pero para lograr un buen trabajo en
BI debemos tener claro cómo seguir el paso a paso por este complejo pero tan útil proceso.

La tecnología y el acceso universal a la información son dos aspectos que llegaron para quedarse, en esta
era y también en las que siguen. Y las empresas no pueden dar un paso al costado ¡O quedarán obsoletas!
Con la fiebre por la automatización y la inteligencia de negocios, el mundo empresarial se ha visto impulsado a
desarrollar su tecnología con el fin de optimizar sus procesos.
Pensemos que en la actualidad existen más de 2.600 millones de smartphones en todo el mundo, y ese número
continúa creciendo. Esto quiere decir que las personas que conforman una empresa tienen en sus bolsillos una
herramienta con un gran potencial.
Y los números lo confirman. El 71% de los empleados en una empresa utilizan dispositivos móviles, y estos
invierten más de dos horas a la semana en acceder a la información de la compañía desde estos dispositivos.

Gracias a esta nueva forma de interactuar te tenemos una excelente noticia: las
empresas ganan 240 horas de tiempo de producción, lo que significa que es muy
necesario que tu software BI se adapte a los cambios de actitud de la empresa
respecto a las tecnologías móviles.

Además, se calcula que en 2020 más del 40% de las tareas de ciencias de datos o Business Intelligence serán
automáticas, aquello tendrá como resultado una mayor productividad y un mayor uso por parte de los “científicos
de datos civiles”.
Con toda esta información ¿estás preparada o preparado para sumarte a este cambio tecnológico?
En esta Unidad te guiaremos para que te sumerjas en el uso de distintos software de BI y su conocimiento tanto
teórico como técnico, con un taller que consta de videos tutoriales que te ayudarán a implementar tus
aprendizajes sobre Business Intelligence en tu contexto laboral, para que así logres aportar en los grandes
cambios tecnológicos que mejorarán la productividad de tu empresa.
Entonces ¡Comencemos!
Business Intelligence

El proceso del Business Intelligence


¿Recuerdas cuando conocimos el proceso del Business Intelligence como Sistema de Apoyo a la Toma de
Decisiones?
Durante estos artículos profundizaremos más en las etapas de Fuentes de datos, ETL, Data Warehouse,
Procesamiento de cubos de información y Visualización. Y aprenderemos cómo llevarlos a cabo para tu trabajo
en Business Intelligence.
En este artículo revisaremos las fuentes de datos y ETL. Utiliza este mapa de avance para ubicarte en qué parte
del proceso del BI te encuentras.

Conceptualizando las Fuentes de Datos y ETL (Extracción, transformación y


carga)
Imaginemos un pequeño río que baja por las montañas cuyo caudal lleva agua desde sus cumbres y en el camino
arrastra diversos minerales, piedras y algunos insectos. Más natural no puede ser.
Pero cuando bajamos por el valle, vemos que este río se cruza con una planta de tratamiento de aguas, cuya
finalidad es filtrar el agua para el consumo en la ciudad, donde se seleccionará sólo el agua, y quedarán atrás las
piedras y los insectos.
Si miramos con mayor perspectiva este paisaje, nos daremos cuenta de que no sólo es un río el que debe pasar
por esta planta, sino que son muchos más los que también deben ser "procesados" para el consumo humano.
Así, como el curso de estos ríos naturales, las fuentes de datos son todos aquellos medios de los que
deberemos obtener los datos. En el caso de los ríos estos datos pueden ser los insectos, piedras, minerales o
sólo el agua que recorre las montañas.
Business Intelligence

El siguiente proceso corresponde al ETL (Extracción, transformación y carga), lo que implica la extracción de
datos desde diferentes fuentes, su transformación en un lenguaje unificado y la carga a una nueva base de datos
para su visualización.
En nuestro ejemplo este proceso se vería representado en la planta de tratamiento de aguas, donde se hace la
extracción de las piedras e insectos del agua y ésta se carga en un nuevo curso para la distribución al consumo
humano.

1. Los tipos de fuentes de datos y el proceso de Extracción


Las fuentes de datos pueden ser estadísticas tomadas de un sistema como por ejemplo:

Desliza el mouse por cada una de las imágenes para visualizar el contenido.

ERP: (Sistema de Planificación de Recursos Empresariales)


CRM: (Gestión de las Relaciones con Clientes)
Contabilidad: Sistema de control de operaciones económicas que realiza una organización.
Sistema de inventario: Registro de mercancías existentes y establecer costo de las vendidas.

A todas estas fuentes sistémicas de datos las llamaremos sistemas operacionales, ya que, como su nombre lo
indica, provienen de sistemas que permiten la operación del negocio.
Pero esto no siempre es tan fácil, ya que las fuentes de datos no son solamente datos esquematizados, sino que
también pueden corresponder a, por ejemplo, planillas de cálculo provistas por una persona, a correos
electrónicos o un archivo de texto con información relevante para elaborar un reporte.
Por ello, cualquier medio de información puede ser considerado como una fuente de datos. A todo este
proceso de obtención de datos desde diferentes fuentes se le llama “Extracción”, que corresponde a la
identificación del sistema y de los datos que se almacenarán en una nueva base de datos.

2. El proceso de Transformación y Carga de datos


La diversidad de fuentes y datos que se encuentran en una empresa es de una tremenda complejidad, y el reto
que nos presenta el Business Intelligence es que cada sistema, para ser óptimo en lo que hace, almacena los
datos de una manera única y en el formato que sus diseñadores estiman conveniente.
Por ejemplo, el gerente de producción de una empresa de tecnología utiliza el ERP y guarda la información del
cliente de una determinada manera. Pero el gerente de marketing utiliza un sistema CRM guardando datos de
esos mismos clientes de otra forma.

Esto significa que en nuestro trabajo de Business Intelligence, después de obtener los datos desde los
sistemas operacionales, tengamos que “unificar” la información para que quede guardada en una nueva
base de datos.
Business Intelligence

Esta información, quedará como nueva, ya que estará guardada en un sólo “lenguaje” orientado al
mejoramiento en la generación de reportes”. Entonces, tal como el agua potable que sale de nuestras llaves
luego de un largo proceso, el producto de nuestro trabajo será una transformación. Y justamente es así como se
llama este proceso.
Finalmente, todos estos datos son cargados a una base de datos diferente a la de los sistemas operacionales y
data en general, que tiene la información unificada y transformada para poder ser entendida por el sistema de
reportes (visualización). Este proceso recibe el nombre de “Carga”.
En la siguiente infografía podrás ver de forma gráfica cómo funciona este proceso tan importante para lograr tener
una buena y verídica base de datos que nos permite continuar avanzando en el proceso del Business Intelligence.

Es momento de practicar
Te invitamos a descargar esta planilla Excel con una fuente de datos de ventas simulada de una empresa ficticia.
El llamado es a que la observes y la estudies, ya que este documento lo utilizarás más adelante para las
actividades del taller de esta Unidad.

Descarga: Excel Datos de Ventas DESCARGAR

Además, te recomendamos que comiences a buscar otro documento similar en tu ámbito laboral para que puedas
utilizarlo y te familiarices con el trabajo de Business Intelligence de tu empresa mientras practicas con nosotros.

Comparte tu experiencia
¿Cómo funcionan los sistemas y fuentes de datos en tu empresa? ¿Crees que al momento de realizar el primer
paso en el proceso de BI tendrás desafíos? ¿Cómo crees que se podrían solucionar estos retos?
Business Intelligence

Internándonos en el Data Warehouse y Base de Datos


Ya sabemos que una vez que extraemos los datos de sus fuentes, debemos guardarlos. Este proceso se llama
Data Warehouse y constituye una etapa de gran importancia. Aquí es donde utilizamos software y tecnología con
gran capacidad para guardar la información. ¡Te invitamos a conocer el mundo del almacenamiento!

La era paleolítica fue un periodo de la historia de la humanidad que se inició hace 2,85 millones de años y se
caracterizó por el desarrollo de las sociedades cazadoras recolectoras, que viajaban de un lugar a otro buscando
alimento y protección.
Estas tribus, durante los climas templados salían a recorrer el territorio extrayendo alimentos de la vegetación
salvaje y cazando animales, que les servían de alimento y abrigo. Estos elementos eran utilizados por las tribus,
pero también eran guardados, ya que los utilizaban en las temporadas frías para alimentarse en periodos de
escasez.
Los investigadores han descubierto que los cazadores y recolectores se dedicaban con gran preocupación al
almacenamiento, y aprendieron que existían diversos frutos que podían conservarse sin perder sus propiedades
para entregarle energía a las tribus. Así, eran muy comunes los frutos secos como nueces o castañas, los que se
convirtieron en la reserva de emergencia de nuestros antepasados.

Para los cazadores recolectores el almacenamiento era un medio fundamental de


cara al futuro, ya que les permitía preveer las circunstancias futuras y tener mayor
seguridad de sobrevivencia. El Business Intelligence, aunque parece totalmente
lejano, comparte con el humano prehistórico este valor esencial.

Esto, ya que en sus primeras etapas, al momento de extraer la información, es muy importante guardarla en
poderosas bases de datos para generar un espacio de fácil acceso ante cualquier necesidad futura de
información.
Lo que para los cazadores recolectores eran nueces y castañas, para nosotros son datos que protegemos para
poder utilizar cuando los necesitemos.

El Data Warehouse
Las bases de datos son el tercer paso del proceso de Business Intelligence. Recordemos en la siguiente infografía
el lugar que ocupa el Data Wareouse en el proceso de la construcción de Inteligencia de Negocios.
Business Intelligence

¿Recuerdas qué es el Data Warehouse? Exactamente, consiste en una base de datos. Y este sistema, tal como
hacían los cazadores recolectores, consiste en la recolección de datos, los que luego son guardados para que
pueda accederse a ellos de manera fácil y eficiente.
Así, un Data Warehouse es un repositorio unificado para todos los datos que recogen los sistemas de una
empresa. Este puede ser físico o lógico y busca la captura de datos desde diversas fuentes ya sea para fines
analíticos como de acceso.
Esta arquitectura de almacenamiento de datos, permite organizar, comprender y utilizar la información para
tomar decisiones estratégicas en el proceso del Business Intelligence.

¿Cómo funcionan las bases de datos?


Como te contábamos en el artículo anterior, en esta Unidad aprenderemos a utilizar diferentes software para
poner en práctica nuestros conocimientos en el BI. En este contexto, una de las cosas que aprenderemos es a
construir un Data Warehouse.
Pero para poder entender cómo hacerlo, debemos conocer primero el funcionamiento de una base de datos.
Business Intelligence

Una base de datos es un sistema de recolección de datos, guardados de forma tal,


que puede accederse a ellos de manera rápida, eficiente y precisa. Es importante
recalcar que las bases de datos tienen dos corazones principales: el Motor de Base
de Datos y el Administrador.

1. El Motor de Base de Datos:


El motor de la base de datos es el software capaz de manejar esta data, dada su magnitud y amplitud.
Por ello, es el corazón cibernético de la base de datos. Y aunque parezca romántico, este motor no es manejable
por el usuario, por lo que, para poder hacerlo, es necesario tener un Administrador de Bases de Datos.
Pero no te preocupes, porque en la actualidad, casi todos los motores de bases de datos vienen con su
administrador incorporado. Estos son los programas que puedes utilizar:

Despliega el contenido haciendo clic en cada título.

Microsoft SQL Server

SQL Server 2019 incorpora características innovadoras de seguridad y cumplimiento, rendimiento líder del
sector, alta disponibilidad para tus cargas de trabajo críticas y análisis avanzados en todas tus cargas de
trabajo de datos, y ofrece compatibilidad con big data.

Oracle 10g o 11g

Oracle Database es un sistema de gestión de base de datos de tipo objeto-relacional (ORDBMS, por el
acrónimo en inglés de Object-Relational Data Base Management System), desarrollado por Oracle
Corporation.

MySQL

MySQL es la base de datos de código abierto más popular del mundo. Por su rendimiento, confiabilidad y
facilidad de uso comprobados, MySQL se ha convertido en la opción de base de datos líder para
aplicaciones basadas en la web ya que es utilizada por propiedades web de alto perfil como Facebook,
Twitter, YouTube y los cinco sitios web más importantes*. Además, es una opción extremadamente popular
como base de datos integrada y es distribuida por miles de ISV y OEM.
Business Intelligence

2. El Administrador:
El administrador de la Base de Datos es el corazón humano de este proceso, ya que es el software que nos
permite interactuar con el motor, visualizar los datos, realizar consultas (queries) y crear funciones de
programación y mantenimiento.
Por esa misma razón, un sistema de bases de datos es capaz de manejar múltiples bases, con muchos datos
cada una y debe cumplir todo lo que le pide el administrador.
Por ejemplo, un servidor de bases de datos debe manejar millones de consultas, desde cientos de usuarios
diferentes, a miles de bases de datos distintas, e incluso desde variados sistemas operacionales.
¡Es un enorme trabajo!
Pero no siempre es así. Porque por lo general, cada sistema operacional contiene una base de datos propia,
donde almacena la información de cada transacción realizada, usuarios conectados, clientes, proveedores,
relaciones entre ellos, etc.
Por eso la configuración de una base de datos varía en razón de la complejidad del sistema operacional que
la necesite.
Conociendo estos dos aspectos del Data Warehouse, y su relevancia en torno a las funcionalidades y
capacidades de cada uno, estaremos preparados para crear nuestro propio sistema de almacenamiento. ¿Estás
preparada(o)?

Es momento de practicar Para crear nuestro primer Data Warehouse, debemos


descargar un administrador de base de datos. El que utilizaremos será MySQL, una base de datos de libre
distribución perteneciente a la empresa Oracle.
Business Intelligence

Para descargar la base de datos ingresa a www.mysql.com y sigue las instrucciones que te damos en el taller de
esta Unidad, en el video llamado “Descarga Mysql”.

Para apoyarte en esta etapa te recomendamos leer el material de profundización “Las 3 formas normales de
Fred Coulson”, que explica de manera muy educativa cómo se crea una base de datos, con el objetivo que sea
consistente y eficiente. Es un material muy ilustrativo y que te ayudará a complementar tus conocimientos sobre
bases de datos, que escapan al alcance del contenido de este curso.
¡Mucha suerte!

Comparte tu experiencia
¿Cuál es la importancia del almacenamiento de datos en tu empresa? ¿Crees que puede solucionar problemas
que se viven diariamente en la organización?
Business Intelligence

Creando un Data Warehouse


¿Te parece si seguimos avanzando en el proceso de la creación de una base de datos? Si bien sabemos que
esta puede ser una etapa compleja, también somos conscientes de que es muy importante, para dejar establecida
toda la información útil para el futuro. Por eso, en este artículo conoceremos algunos puntos a tener en
consideración en la preparación para crear una base de datos.

Data Warehouse significa "Base de Datos". Es donde se almacena la información relevante y su objetivo es
“aliviar” la carga de los sistemas operacionales. Es decir, un Data Warehouse es, literalmente, una Bodega de
Datos.
Veamos un ejemplo de la importancia que tiene esta bodega de datos para aliviar los sistemas operacionales:

Suele suceder que un sistema ERP tiene mucha carga de transacciones,

Desde diferentes usuarios, con muchas sucursales y diferentes módulos del ERP (contabilidad, finanzas, ventas,
facturación, cobranzas, etc).

Y todo esto recae sobre una base de datos del sistema ERP
Business Intelligence

Si a esto sumamos otra gran cantidad de usuarios que quieren obtener reportes de esta base de datos,

Se puede provocar la caída del sistema o su ralentización, haciendo que toda la organización funcione más lenta,
provocando ineficiencias y frustración en los usuarios del sistema. Un verdadero dolor de cabeza.

La importancia de un buen servidor


Es altamente recomendable contar con un almacén de datos, ojalá en un servidor diferente, es decir un sistema
encargado de transmitir la información para el correcto funcionamiento de la organización.
En el siguiente video te dejamos una explicación sobre los servidores y cuál es su utilidad.

Por lo tanto, necesitamos un servidor que guarde esta información (no todo el ERP) para consultas de reportes
posteriores.
Asimismo, la base de datos nos servirá para consolidar información cuando viene de sistemas diferentes.
De esta forma, si necesitamos unificar información desde un ERP, un CRM o algún otro sistema, es bueno reunir
esta información previamente y guardarla en un Data Warehouse con un buen servidor, para después
consultarla, ya que de lo contrario, conseguir un reporte que saque datos desde todos los sistemas operacionales
al mismo tiempo, se hace técnicamente muy complejo.
Así, tanto los reportes como los sistemas operacionales funcionarán de mejor forma.

Un dato que te ayudará. ¿Cuándo efectuar el ETL?


Es importante destacar que el proceso de ETL siempre se programa para que se ejecute en el minuto en que la
organización tiene menor actividad, por lo general, de noche.
En ese lapso, la información es extraída desde los sistemas operacionales (que ya no están cargados con las
Business Intelligence

transacciones de su propia explotación) hasta nuestro almacén de datos, que será consultado al día siguiente.
Así no tendrás mayores problemas.

Es momento de practicar
Ahora que ya tenemos las nociones básicas acerca de una base datos y que hemos podido descargar e instalar
nuestro motor de base de datos, te invitamos a diseñar nuestro Data Warehouse en la sección de Taller de la
Unidad 3 y con el título “Creación de tu base de datos”.
¡Manos a la obra!

Comparte tu experiencia
¿Qué desafíos has experimentado durante este proceso? ¿Cómo has podido resolverlos?

Business Intelligence

13
Business Intelligence

La funcionalidad de los Data marts o cubos de información


Como si fuese una semilla recién germinada, estamos en la etapa en que comenzamos a ver cómo los datos se
transforman en información. Un Data mart es una versión especial del Datawarehouse, ya que es un subconjunto
de datos que le ayudará a un área específica en la organización a tomar mejores decisiones. En este artículo
conoceremos su estructura y su utilidad en la empresa.

Piensa en tu cocina, e imagina que llegas con muchas bolsas de tus compras desde el mercado. Cuando
guardas tus alimentos, le dedicas un lugar especial a cada tipo de comida, ¿verdad? Por ejemplo, los
carbohidratos van en la alacena, las carnes en el congelador, las frutas en un canasto, etc. ¿Y por qué lo haces?
Porque necesitas que cada alimento esté en buenas condiciones cuando los necesites y para ellos debes cuidar
cada tipo de necesidad especial de conservación. Al menos esa es la lógica más básica.
Esta misma idea es la que usamos cuando hablamos de los Data marts o cubos de información, ya
que organizamos esta gran cantidad de datos (o alimentos según el ejemplo) en distintas categorías. Y la idea
es que cumplan una funcionalidad específica, de acuerdo a las necesidades de la organización.
Por eso, a diferencia de lo que ocurre con las bases de datos, que son grandes cantidades de información
procedente de muchos centros de datos, los Data marts son unidades mucho más pequeñas y organizadas.
Business Intelligence

Definiendo un Data mart


Entonces, ¿si un Data mart es un subconjunto del Data Warehouse, este utiliza solo una parte de la información
de la base de datos corporativo?
Exactamente, y con un procesamiento extra, ya que esto permitirá optimizar la consulta de reportes de los
usuarios.
Es importante destacar que los Data marts o cubos de información suelen ser nombrados de acuerdo a la
funcionalidad que cumplen. De esta manera, encontramos distintos tipos de Data marts, como por ejemplo:

Desliza el mouse por cada una de las imágenes para visualizar el contenido.

Data marts de ventas

Data marts de finanzas

Data marts de gestión

Así como vemos, los datos se agrupan en categorías útiles y fáciles de utilizar para cada área de la empresa.
Ahora, ¿sabes cuál es la diferencia entre un Warehouse y un Data marts?
La principal diferencia, y esto es muy importante, es que los Data marts son consultados directamente por los
usuarios, mientras que un Warehouse es solamente la fuente de alimentación de datos para Data marts.
A continuación veamos el proceso del Data marts desde su división en el Warehouse hasta la llegada a los
usuarios.
Business Intelligence

¿Cómo crear un Data mart?


Antes que profundicemos en este tema, es importante que pongas atención a esto:
Las configuraciones y diseño en esta etapa no siempre son estáticas, estas pueden variar, dependiendo del
tamaño de la organización, así como de sus políticas de información y datos.
Por ejemplo, una organización puede considerar que no necesita tener un Data Warehouse y pasar directamente
la información desde sus sistemas operacionales a Data marts de información.
Por eso, cada empresa, en conjunto con su departamento de TI, establece las mejores configuraciones que estima
necesarias para el mejor funcionamiento de sus sistemas de Inteligencia Empresarial.
Eso es un punto muy importante a considerar en tu contexto laboral.
Ahora que tenemos esto claro. Sumerjámonos en la creación de un Data mart:
Para crear un Data mart debemos centrarnos en su objetivo, ya que de esta forma podremos apoyar los
procesos de toma de decisiones del área en que estamos trabajando.
Por ejemplo:

Imaginemos que en nuestra empresa, debemos crear un Data mart para el área de ventas.

Antes de insertarnos en el mundo de los programas y software, debemos pensar qué tipo de información
necesitamos recopilar en el cubo de información de ventas. Para ello usaremos los objetivos estratégicos
planteados en el Balanced Scorecard (BSC).
Business Intelligence

Por lo general los objetivos y metas de estas áreas, se relacionan con las perspectivas financieras y de clientes.
Entonces, los datos que necesitamos entregarle a los usuarios de esta sección, deben estar alineados con el
cumplimiento de estos objetivos.

¿Qué tipo de información utilizarías en este Data mart para ayudar al área de ventas? Una buena forma de
entregar datos útiles, puede ser a través de la clasificación de las ventas. Por ejemplo, por región, barrio, grupo de
ventas y por vendedor.

Ahora, imagina que ya creaste el Data mart y que un usuario generó su primer reporte para la gerencia de ventas.

Con la información obtenida, la o el Gerente podrá tener una visión amplia de las ventas totales de su gerencia. Y
también podrá ver detalles, como por ejemplo, en qué regiones tiene bajas ventas.
Business Intelligence

Si encuentra una disminución de las ventas en una región en particular, podrá revisar los barrios de esa región y,
finalmente, dentro de los barrios con menor performance, podrá analizar qué grupo o qué vendedor está bajo su
expectativa de cumplimiento.

Como vemos, el Data mart ayuda enormemente a que el proceso de Business Intelligence sea mucho más
efectivo, ya que estos datos dejarán de ser números sin significado y se transformarán en información acerca de
qué parte de cada gerencia está funcionando bien o mal, y así se podrán tomar acciones que le permitan cumplir
con el objetivo estratégico final. ¡Es toda una evolución!
Y esto no termina en el reporte final, ya que los objetivos estratégicos tienen metas, las que nos guiarán para
saber si los resultados de nuestro trabajo son acordes o no, a lo que hemos planificado.

Comparte tu experiencia
Te invitamos a aplicar estos conocimientos a tu contexto laboral. Clasifica cada área de tu empresa y determina
qué tipo de Data marts sería útil para cada una. ¿Cómo crees que este proceso beneficiaría a tu empresa?
Business Intelligence

Conociendo la Tabla de Hechos y su importancia


Desde que el ser humano comenzó a escribir, se inició la historia de la humanidad. Con ese dato, podemos
darnos cuenta de que el registro ha sido fundamental para ser quienes somos y hasta el día de hoy es de gran
importancia en todo ámbito. En el mundo empresarial el registro no sólo ha sido útil para conocer una información
específica, sino que también ha ayudado a muchas organizaciones a aumentar el conocimiento para un
desarrollo efectivo en el presente y hacia el futuro.

Es increíble el uso que se da en el mundo laboral a las planillas. Hay una grilla para todo, desde la planificación
del trabajo personal hasta el control de grandes empresas y sus finanzas. ¿Tú también las usas a diario?
Como bien sabemos, el uso de esta forma de registro es realmente muy necesaria para ordenar la información, y
por ende su función es muy utilizada en el Business Intelligence.
En este artículo revisaremos la importancia que tienen las planillas o Tablas de Hechos en la construcción de un
Data mart y los distintos modelos en que puede ser representada según las necesidades de la empresa y las
características de los datos a registrar.
Recordemos que los Data marts son cubos de información que categorizamos a partir del Data Warehouse y que
servirán para el uso específico de las diferentes áreas de una empresa.

¿Qué es una Tabla de Hechos?


Si seguimos con el ejemplo del Data marts para el área de ventas de nuestra empresa ficticia, la información que
organicemos para este cubo deberá ser capaz de reflejar de manera fiel y confiable las ventas realizadas con el
nivel de detalle que sea requerido, a fin de aportar la mejor información posible.
¿Y cómo se puede lograr esto? Con una planilla, tabla principal o Tabla de Hechos que organizará los datos
mínimos requeridos para registrar los hechos a analizar, en este caso, las ventas.

Entonces, una Tabla de Hechos es una estructura que nos permite organizar la información de tal forma
que sea mucho más fácil de visualizar y encontrar.

Esta planilla, nos mostrará acciones realizadas bajo ciertos criterios, (en el caso de ventas puede mostrar
sucursales, equipos, zonas, supervisores, etc.) y pueden estructurarse de diferentes formas, lo que explicaremos
más adelante.
Ahora ¿recuerdas la planilla que descargaste en el primer artículo de esta unidad? Bueno, llegó el momento de
que la abras y analicemos juntos esta Tabla de Hechos.
Business Intelligence

En esta imagen vemos que la Tabla de Hechos representa las ventas realizadas de acuerdo a ciertos criterios,
destinados a cumplir el objetivo estratégico de la compañía. Como por ejemplo: Sucursal, Equipo, Zona, etc.
Pero ¿sabes cómo diseñar estos criterios? A continuación te lo enseñaremos.

Los criterios de la Tabla de Hechos


Al momento de construir una Tabla de Hechos es muy importante tener claras algunas definiciones que nos
ayudarán a plantear los criterios que utilizaremos para clasificar la información.
Veamos cuáles son estos conceptos:

Medida
Es la cantidad que queremos medir. En el caso del ejemplo del área de ventas, las medidas son las cantidades
vendidas, que al mezclarlas con el precio, nos entregan el monto de ventas.
Business Intelligence

Dimensión
Es el punto de vista con el que se quiere analizar las ventas. Volviendo al ejemplo, las dimensiones son fecha,
sucursal, equipo, zona, etc.

Debes tener en cuenta que las medidas siempre representarán un valor numérico, mientras que las
dimensiones, mostrarán los criterios de ordenamiento o de visión, los que pueden ser temporales o de otro
tipo.
En el caso de nuestro ejemplo, las dimensiones tienen fecha, pero a partir de ese dato se puede obtener
información de semana, mes, trimestre, año y otros.

Tipos de Tablas de Hechos


Ya sabemos qué criterios utilizaremos para crear una tabla de hechos, por lo que ahora debemos pensar cómo
vamos a configurar esta planilla, ya que si hacemos una configuración improvisada, probablemente nos
encontremos con demasiados datos y texto repetidos, lo que con el tiempo se presentará en una sobre carga de
datos.
A continuación, veremos que existen dos tipos de configuración para simplificar las Tablas de Hechos: La Estrella
y El Copo de Nieve.

1. La Estrella:
Este modelo nos permite visualizar una menor cantidad de información y organizarla de manera segmentada,
por dimensiones. Aquello resulta muy útil ya que nos permite tener una visión total de la Tabla y la información
que nos muestra, pero también se puede acceder a información mucho más específica de forma anexa.
Pensando en el ejemplo de nuestra empresa ficticia, en el Área de Ventas, el modelo de “La Estrella” se puede ver
representado de la siguiente forma:
Business Intelligence

Estas dimensiones nos ayudarán a tener una visión mucho más amplia de toda la información disponible
en el sistema. Y nos darán la posibilidad de especificar de forma anexa cada sector.

Así, en nuestro ejemplo para el área de ventas, podemos construir una planilla a partir de las siguientes
dimensiones del modelo “La Estrella”:

Producto: En la columna “Cantidad y Precio”

Tienda: En la columna “Sucursal y Zona”

Tiempo: En la columna “Fecha de creación”

Clientes: En la columna “Cliente”


Business Intelligence

Ahora te preguntarás ¿por qué algunas columnas poseen números en vez del nombre de la sucursal?

Esto ocurre, ya que para tener una visualización más amplia de la información general, se anexan
planillas con información específica a través de esos códigos o IDs, donde hay tablas independientes.

Entonces, por ejemplo, los códigos de sucursal, equipo y zona quedarán guardados en tablas independientes, tal
como se ve en la siguiente tabla:

Sucursal Equipos Zonas

ID Descripción ID Descripción ID Descripción

1 Antofagasta 1 Ventas 1 1 Norte

2 Arica 2 Ventas 2 2 Sur

3 Calama 3 Ventas 3 3 Método

4 Chillán 4 Ventas 4 4 Centro

Así, el esquema “La Estrella” contendrá menos información y quedará guardado como una tabla más liviana, con
referencias a tablas auxiliares con los datos que se repiten constantemente. ¡Simplificar será nuestro mantra
desde hoy!
Cabe destacar que se puede hacer exactamente lo mismo con los supervisores y los vendedores. La ventaja es
que esta configuración es muy rápida para consultas a las bases de datos, y puede recargarse con facilidad si es
que tiene mucho texto repetido en su configuración.
¿Crees que este tipo de estructura te ayudará al momento de construir la Tabla de Hechos en tu contexto laboral?
Business Intelligence

2. El Copo de Nieve:
A la segunda configuración la llamaremos “Copo de Nieve”. Esta es un poco más compleja que la anterior, ya que
su objetivo es ser más detallada.
El “Copo de nieve”, no sólo separa en dimensiones un área, sino que también busca normar la relación entre
ciertas categorías, a través de una jerarquía o de relaciones horizontales.
Sin embargo, tiene como desventaja que cuando el esquema es muy complejo y hay muchos datos, el sistema
puede colapsar y demostrar problemas de rendimiento.

No te angusties si crees que es un modelo muy complejo de desarrollar, porque para el caso de nuestro Data
mart, utilizaremos el esquema Estrella, por la simplicidad de nuestros datos y su poca cantidad.
Pero si quedaste con la curiosidad sobre el modelo “Copo de Nieve” te dejamos un video tutorial, en el que
podrás profundizar sobre su uso e importancia.

Podemos concluir entonces, que las Tablas de Hechos nos permiten organizar la información de forma fácil y
práctica, para así optimizar el trabajo de búsqueda de datos por parte de los usuarios de cada área. Gracias a su
estructura y los modelos que podemos utilizar, será mucho más simple el diseño de la configuración de estas
planillas. El desafío está saber definir de forma adecuada cuáles serán las dimensiones necesarias para cada
sector de la empresa.
Business Intelligence

Es momento de practicar
Ahora que tienes los conocimientos necesarios para la construcción de un Data Warehouse, un Data mart y una
Tabla de Hechos, te invitamos a aplicar tu aprendizaje en el taller de esta Unidad. Allí podrás instalar el Software
MySQL y Pentaho, para la creación de tus propias bases de datos.

Comparte tu experiencia
¿Cuáles serían las dimensiones y el modelo que utilizarías al momento de construir la Inteligencia de Negocios en
tu organización? ¿Consideras que estos mejorarían el manejo de la información de cada área?
Business Intelligence

Materiales complementarios Unidad 3


Material complementario 1: Manual Práctico SQL. Por Álvaro E. García
Business Intelligence

Resumen y Glosario
Resumen
Cualquier medio de información puede ser considerado como una fuente de datos. Al proceso de
obtención de datos desde diferentes fuentes se le llama “Extracción”, que corresponde a la identificación del
sistema y de los datos que se almacenarán en una nueva base de datos.

Después de obtener los datos desde los sistemas operacionales, se debe “unificar” la información para
que quede guardada en una nueva base de datos, pero en un sólo “lenguaje” orientado al mejoramiento en
la generación de reportes. Este proceso se denomina “Transformación”.

Todos estos datos son cargados a una base de datos diferente a la de los sistemas operacionales y data en
general, que tiene la información unificada y transformada para poder ser entendida por el sistema de
reportes (visualización). A este proceso se le llama “Carga”.

Una base de datos es un sistema de recolección de datos, guardados de forma tal, que puede accederse
a ellos de manera rápida, eficiente y precisa. Es importante recalcar que las bases de datos tienen dos
corazones principales: el Motor de Base de Datos y el administrador.

Para crear un Datamart debemos centrarnos en su objetivo, que es poder apoyar al procesos de toma
de decisiones del área en cuestión.

La tabla de hechos tiene dos componentes, la medida y las dimensiones. Las medidas representarán
siempre el valor numérico y las dimensiones, los criterios de ordenamiento o de visión, y que pueden ser
temporales o de otro tipo.

Las tablas de hechos pueden representarse en dos modelos, según la cantidad de data que manejen: el
modelo estrella y el modelo copo de nieve.
Business Intelligence

Glosario
Motor de base de datos: es el software capaz de manejar la data extraída, dada su magnitud y amplitud. Es
el corazón cibernético de la base de datos. Este motor no es manejable por el usuario, por lo que, para poder
hacerlo, es necesario tener un Administrador de Bases de Datos.

Administrador de base de datos: es el software que nos permite interactuar con el motor, visualizar los
datos, realizar consultas (queries) y funciones de programación y mantenimiento.

Datamart o cubo de información: Un datamart es un subconjunto de un Data Warehouse, que tiene parte de
la información del Data Warehouse corporativo, con algún procesamiento extra, y que permitirá optimizar la
consulta de reportes de los usuarios.

También podría gustarte