Está en la página 1de 32

Inteligencia de negocios

Semana 04: Modelo Estrella y sus definiciones


Logro de la sesión

Al finalizar la unidad, el estudiante aprende a como construir un Modelo Estrella y sus


definiciones; se evaluará el cumplimiento del logro a través de un trabajo en el laboratorio
de construcción de una modelo estrella.
Dudas sobre la sesión anterior

¿Tiene alguna consulta o duda de la sesión previa?


Preguntas de repaso:
Conocimientos previos

¿Qué es un Modelo Estrella?


Utilidad del tema

¿Por qué creen que es importante el Modelo Estrella?


¿Para qué nos puede servir?
¿Qué pasa si no lo aprendemos?
Contenido de la sesión:

• Modelo estrella.
• Medidas. Dimensiones
Modelo Estrella en la Actualidad

En el mundo de los datos, no basta con recopilar y almacenar


información. También hay que saber cómo organizarla,
relacionarla y presentarla de forma que se pueda extraer el
máximo valor de ella. Para ello, existen diferentes técnicas de
modelado de datos que nos ayudan a estructurar y optimizar
nuestros datos para el análisis y la toma de decisiones.

Una de estas técnicas es el Modelo Estrella, que se ha


convertido en un estándar en el ámbito del Business
Intelligence y los Data Warehouses.
¿Qué es el Modelo Estrella?

El Modelo Estrella es una técnica de modelado de datos que se


utiliza para diseñar y optimizar almacenes de datos y data
marts. Su nombre se debe a la forma que tiene el esquema
lógico, que consta de una tabla central llamada tabla de hechos
y varias tablas periféricas llamadas tablas de dimensiones.
Estas tablas se relacionan entre sí mediante claves primarias y
foráneas, formando una estructura en forma de estrella.
Ventajas del Modelo Estrella
• Consulta simplificada: Los esquemas en estrella son fáciles de entender e implementar. Su estructura
desnormalizada reduce el número de uniones necesarias para recuperar datos. Esto simplifica y conduce a una
agregación de datos y generación de informes más rápidos.

• Rendimiento más rápido: La complejidad de combinación reducida y la indexación eficiente de las tablas de hechos
y dimensiones mejoran la recuperación de datos. Esto es particularmente importante para los tomadores de
decisiones que requieren un acceso rápido a la información.

• Análisis intuitivo: Los esquemas en estrella permiten un análisis de datos intuitivo y directo. Los usuarios pueden
comprender fácilmente las relaciones y jerarquías entre las dimensiones.

• Soporte robusto: Los esquemas en estrella brindan soporte para estructuras OLAP, como cubos de datos: matrices
multidimensionales que se utilizan para mejorar el análisis de datos.
Desventajas del Modelo Estrella
• Falta de integridad: La desnormalización puede causar redundancia de datos. Los atributos dimensionales suelen
repetirse en varios registros dentro de una tabla de dimensiones, lo que puede provocar problemas de calidad de los
datos. Dado que los datos se duplican en la desnormalización, los cambios frecuentes también pueden hacer que
ciertas tablas muestren información desactualizada.

• Aumento de los costos: Agregar datos redundantes aumenta los costos de computación y almacenamiento. Esto
puede ser especialmente problemático cuando se manejan grandes conjuntos de datos.

• Flexibilidad limitada: Los esquemas en estrella son relativamente menos robustos que las estructuras normalizadas,
ya que están diseñados para casos de uso específicos. Otros enfoques podrían ser más efectivos para consultas
complejas que involucran múltiples uniones.

• Dificultades de mantenimiento: A medida que los datos cambian con el tiempo, mantener un esquema en estrella
puede resultar un desafío. Las actualizaciones de los atributos de dimensión pueden requerir cambios en varios
lugares.
¿Cuándo usar el esquema de estrella?

• Los usuarios tienen una comprensión clara de los datos requeridos. Por ejemplo: la cantidad de productos
vendidos por estado.
• Los datos son estructurados y cuantitativos con algunos atributos categóricos.
• Quieren los datos de forma rápida y sencilla, sin crear múltiples uniones. El rendimiento de las consultas es la
máxima prioridad.
• La redundancia de datos no será un problema.

Los analistas y usuarios comerciales que desean una mayor rigidez de los datos pueden optar por
un enfoque más normalizado. El esquema de copo de nieve es una extensión del esquema de
estrella: se compone de un modelo de estrella normal con tablas de subdimensiones adicionales.

Los esquemas de copos de nieve utilizan un enfoque más normalizado adecuado para menos
redundancia y consultas más complejas.
Modelo de estrella
Modelo de copo de nieve
Cubo de Datos
¿Qué es?
• Centraliza la información, permitiendo el acceso a ésta de manera más rápida y evitando las islas
de información que pueden existir en las organizaciones.
• Provee independencia para la obtención de información.
• Permite generar cuadros y gráficos estadísticos, facilitando obtener diferentes vistas de la
información obtenida y analizarla desde distintas perspectivas.
• Permite el manejo de perfiles para una administración personalizada de la información en función
a las necesidades de cada usuario.

Elementos Preparació
Modelo de un Uso de un Ventajas de
de un Cubo n del Cubo
Cubo de Cubo de un Cubo de
de Datos de Datos
Datos Datos Datos
Elementos de un Cubo de Datos

Dimensiones Medidas
• Constituyen las diferentes perspectivas de
• Métricas, cálculos o valores por los cuales
análisis, las cuales se utilizan como títulos de
fila, columnas o filtros del informe. queremos analizar el resultado de la
• Son los datos sobre los cuales deseamos información.
hacer una consulta.
• Ejemplo: tiempo, vendedor, área geográfica.
Modelo de un Cubo de Datos
Tiene 3 grandes partes:

Extracción de Datos Procesamiento Datamart Explotación de resultados


Modelo de un Cubo de Datos

1. Extracción de datos:
• Acopiar, integrar y homologar toda la información de los sistemas transaccionales de la organización.
• Ejemplo: información que generan los sistemas de los clientes, de los productos, de las agencias, de los canales de atención.

1. Procesamiento de Datamart:
• La información se analiza por diferentes unidades de negocio.
• Este Datamart es un análisis de información de marketing, por lo cual tendremos información del Datamart de marketing, de finanzas y de RRHH.
• Ejemplo: vemos que es un Datamart financiero y se ven las distintas unidades: provisiones, saldos de morosi dad en que caen los clientes y saldos
operativos (saldo de las deudas de los clientes)
• que pueden estar en actual, vencido o judicial.

3. Explotación de resultados:
• Luego de procesar el Datamart, es decir, poblar las principales entidades de información tras haber extraído l os datos, empezamos con la explotación de
resultados por las diferentes dimensiones de información.
Las tablas de dimensiones

Describen entidades empresariales (las cosas que se modelan).


Las entidades pueden incluir productos, personas, lugares y
conceptos, incluido el propio tiempo.

La tabla más coherente de un esquema de estrella es una tabla


de dimensiones de fecha.

Una tabla de dimensiones contiene una columna (o columnas)


de clave que actúa como identificador único y columnas
descriptivas.
Las tablas de hechos
Pueden almacenar observaciones o eventos, y pueden ser pedidos de ventas,
existencias, tasas de cambio, temperaturas, etc.

Una tabla de hechos contiene columnas de clave de dimensiones relacionadas con las
tablas de dimensiones y columnas de medida numéricas.

Las columnas de clave de dimensiones determinan la dimensionalidad de una tabla de


hechos, mientras que los valores de clave de dimensiones determinan
la granularidad de una tabla de hechos.

Por ejemplo, imagine una tabla de hechos diseñada para almacenar objetivos de
ventas que tiene dos columnas de clave de dimensiones Date y ProductKey.

Resulta fácil comprender que la tabla tiene dos dimensiones. Pero la granularidad no
se puede determinar sin tener en cuenta los valores de clave de dimensiones.

En este ejemplo, imagine que los valores almacenados en la columna Date son el
primer día de cada mes. En este caso, la granularidad está en el nivel mes-producto.
Las tablas de hechos y Dimenciones
Dimensión tiempo
Métricas de Ventas por la Dimensión de Tiempo
Practica

En la clase de practica diseñaremos un modelo estrella para el área


comercial de una empresa, con los siguientes requerimientos:

Reporte de ventas por período de tiempo:


• Ventas totales de la empresa por día, semana, mes o año, según lo requiera el
usuario.
• Desgloses detallados de las ventas por producto, territorio, canal de venta, y
cualquier otra dimensión relevante.
• Reporte por diferentes criterios, como región geográfica, categoría de producto, o
cliente.
Dudas sobre la sesión Actual

¿Tienen alguna consulta o duda?


Actividad

Resolver la actividad planteada en la


plataforma.
Cierre

¿Qué hemos aprendido hoy?

Elaboramos nuestras conclusiones


sobre el tema tratado

También podría gustarte