Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCION
A través de la experiencia en el trabajo, he aprendido que todo lo que hagamos para que
resulte “bien hecho”, debe tener un protocolo, proceso, algoritmo, pasos a seguir o como
ud. lo quiera nombrar, pero siempre siguiendo un método o técnica que ha establecido la
autoridad en la materia, ya sea una empresa o un experto, cierto ¿?
Siempre cuestione todo, esa es una buena costumbre. Un buen diseño va a evitar muchos
problemas posteriores, así que bien vale la pena entender esta técnica y aplicarla.
Todas las tablas de hechos tienen una o más llaves externas(Foreing Keys,FK) que
conectan con las llaves primarias(PK) de las dimensiones.
La(s) tabla(s) de hechos debe(n) ser diseñada(s) en base al elemento atómico, es decir al
nivel máximo de detalle para poder hacer frente a las consultas impredecibles del usuario.
Los datos no deben ser estructurados conforme a interpretaciones individuales de los
departamentos, sino en base a “procesos empresariales”
Es hecho o atributo de dimensión ? Por lo general valores numéricos son casi siempre
hechos. Antes de pensar en el modelo estrella o cubos, debes tener un diseño realizado
de la mejor manera posible en lo que se refiere a tablas de hechos y dimensiones.
3. No son escalables
Mejores prácticas
3.1 Los modelos dimensionales deben ser diseñados en colaboración con expertos en la
materia y representantes de la empresa con facultad para la toma de decisiones en los
datos.
3.2.4 Identificar los hechos. Hechos, son las mediciones que resultan del evento del
proceso de negocio y casi siempre son numéricas.
El modelo dimensional es flexible cuando las relaciones entre los datos cambian. Los
siguientes cambios pueden ser implementados sin alterar ningúna consulta BI o de
aplicación existente y sin ninguna alteración a los resultados de dichas consultas.
1. Hechos coherentes con el grano de una tabla de hechos existente, pueden ser
agregados creando nuevas columnas
2. Dimensiones pueden ser agregadas a una tabla de hechos existente, creando nuevas
columnas para almacenar FK, cuidando que no alteren el grano de la tabla de hechos.
3. Atributos pueden ser añadidos en una tabla de dimensión existente, creando nuevas
columnas.
4. El grano de una tabla de hechos puede hacerse mas atómico, añadiendo atributos a una
tabla de dimensión existente y luego reiniciando la tabla de hechos al grano más atómico,
siendo cuidadoso en conservar los nombres de columnas tanto en la tabla de hechos
como de dimensión.
Técnicas básicas para el diseño de una Tabla de Hechos (Aplican para cualquier tabla de
hechos)
Además de medidas numéricas, una tabla de hechos siempre contiene foreign keys para
cada una de sus dimensiones asociadas y opcionalmente FK degeneradas de dimensión y
date/time stamps. Las tablas de hechos son la primer fuente para cálculos; son
increíblemente eficientes porque contienen solo FK de dimension y medidas, fueron
creadas para representar relaciones muchos a muchos entre dimensiones.
2. Valores nulos deben evitarse en una tabla de hechos porque pueden ocasionar
violación a la integridad referencial.
Estructura. Toda tabla de dimensión tiene una PK que está embebida como foreing key en
cualquier tabla de hechos con la que esté asociada. Tablas de dimensión por lo general
tienen una cantidad considerable de columnas, planas, denormalizadas, con baja
cardinalidad en los atributos o campos de texto. (Recordemos que Cardinalidad se refiere
a la unicidad de los valores contenidos en una columna en particular de una tabla. A
menor cardinalidad, mayor duplicidad y viceversa.)
Mientras que valores numéricos e indicadores pueden ser tratados como atributos, los
atributos mas poderosos de una tabla de dimensión son descriptivos, tipo texto. Los
atributos de una tabla de dimensión son la fuente primaria para la definición de
restricciones y agrupaciones desde queries y aplicaciones BI. Las etiquetas descriptivas en
reportes, son típicamente valores atributos de dimensión.
Es la manera fundamental como los usuarios analizan los datos. Significa simplemente
añadir un atributo de dimensión al SQL query, agregado a la expresion group by. El
atributo puede proceder de cualquier dimension ligada a la tabla de hechos. No requiere
la definición de jerarquías predeterminadas o rutas drill-down.
Evitarlos, en su lugar substituirlos por cadenas como “No Aplica”, para no ocasionar
inconsistencias.
Dimensiones Conformadas
Una tabla de dimensión conformada es aquella que tiene el mismo significado para
cualquier tabla de hechos con la que esté relacionada. Permiten organizar y describir
hechos y medidas de igual manera a traves de multiples tablas de hechos o data marts ,
asegurando consistencia en los reportes en toda la empresa.
Una tabla de dimensión conformada, puede existir como una sola tabla que está
relacionada con múltiples tablas de hechos en el mismo almacén de datos(data
warehouse ) o como tablas de dimensión idénticas en data marts separados. Por ejemplo,
“Fecha” es una tabla de dimensión conformada muy común, porque sus atributos(dia,
semana, mes ,cuatrimestre, año, etc) tienen el mismo significado cuando se liga a
cualquier tabla de hechos. Otro ejemplo: una tabla de dimensión conformada, llamada
“producto” con el nombre del producto, descripción, y otros atributos comunes pueden
existir en múltiples data marts, cada uno almacenando datos de una tienda de la cadena.
Cadena de Valor
Identifica el flujo natural del proceso de negocio primario de una organizacion. Cada
proceso, típicamente deriva en el menos una tabla de hechos.
Sirve para construir la matriz del almacén de datos (data warehouse bus matrix) y estas
técnicas pueden ser aplicadas tanto a bd relacionales como multidimensionales.
Es una herramienta esencial para el diseño del almacén de datos. Las filas de la matriz, son
los procesos de negocio y las columnas son las dimensiones. Las celdas sombreadas
indican si una dimensión está asociada con un proceso. El equipo de diseño verifica cada
fila para corroborar si cada candidato a ser dimensión está correctamente definida para
ese proceso de negocio, así como verifica también cada columna para cerciorarse si esa
dimensión debe ser parte o incluída en varios procesos de negocio. Además de las
consideraciones técnicas, la matriz es utilizada para priorizar los proyectos DW/BI.
Es una matriz a un mayor nivel granular, donde cada fila que contiene un proceso de
negocio, es detallada para mostrar tablas de hechos específicas o cubos olap. A este nivel
de detalle, los hechos pueden ser documentados.
En esta matriz, las columnas son funciones del negocio, en lugar de las dimensiones, por
ejemplo, ventas, créditos, y entonces las celdas sombreadas las utilizamos para indicar
cuales funciones del negocio interesan a que proceso del negocio. Esta matriz ayuda a
identificar que grupos de negocio pueden o deben ser invitados a colaboraren en este
proceso.
Error 2: Esperar que los usuarios realicen consultas a datos atómicos normalizados