Está en la página 1de 38

Modelamiento Multidimensional

El Modelo de Datos Multidimensional

Parte Dinámica (operadores)

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Conjuntos de Hechos Compatibles:

Diremos que dos conjuntos de hechos H y L, tales que:

h : ED1 → EE1
l : ED2 → EE2

son compatibles, si y sólo si:

ED1 ⟺ ED2 y EE1 ⟺ EE2

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Tipos de Objetos en el Modelo de Datos Multidimensional

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Componentes de una Variable Multidimensional


¿De que se nutre?

Puntos de vista

Dimensiones

Jerarquías
Sintaxis
espacios de Atributos
clasificación
Espacio Escalar
Dominios
Medidas sintaxis

Funciones de agregación Dominios

Indicadores
Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V
Modelamiento Multidimensional

Dimensión:
Una dimensión es una 3-tupla (nombre, D, jerarquía) tal que:

Y la jerarquía será una 5-tupla (nombre, E, ≤, T, V).

Llamaremos esquema dimensional (ED) al conjunto que identifica los atributos que
componen la dimensión y que se estructuran de acuerdo a una jerarquía.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

1
2
3

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Espacio Dimensional:
Llamaremos Espacio Dimensional, denotado por ED, al espacio de clasificación
formado por el producto cartesiano de todos los dominios de los atributos de cada
dimensión:

Los elementos de ED (casillas) recibirán también el nombre de elementos


dimensionales.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Espacio Dimensional:

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Medidas:
Son características cuantitativas de interés, las cuales se someten a estudio a
través del modelo multidimensional.

Definición: Una medida es un valor numérico (generalmente agregado), que


representa una característica o propiedad cuantitativa de interés en un área o
aspecto específico de la problemática en estudio.

Una medida siempre es total y funcionalmente dependiente del los valores que
componen una casilla del espacio dimensional.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Espacio Escalar:
En el contexto del modelo multidimensional, es el producto cartesiano de los
dominios subyacentes a las medidas. Lo designaremos por EE.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Definición de un HECHO:
Sea ED un espacio multidimensional y sea EE un espacio escalar, ambos
relativos a un área de interés específica. Definiremos un hecho como una
función h que asocia un elemento del espacio dimensional con un elemento del
espacio escalar:

Sus elementos, son pares ( ed(x), ee(x) ), tales que:

Donde ed(x) representa un elemento de ED, y ee(x) representa un elemento


de EE.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Conjunto de Hechos:
Un conjunto de hechos, también denominado variable
multidimensional o cubo, es una estructura de datos compleja, que
contiene información relevante respecto de un área temática de
interés.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

De esta forma, la estructura de las dimensiones quedará conformada por:

CodAsig → Tipo → Carrera → Depto → Facultad

Unidad
Tiempo
Semestre → Año

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Podemos analizar la dedicación del cada académico a la docencia


comparando las horas de clases efectivas respecto de sus horas de
contrato, por tanto, almacenaremos los siguientes indicadores:

• Cantidad de horas de clases


• Cantidad de horas de contrato

Programa
(Horas de clases, Horas de contrato)

Tiempo

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Ejemplo: La siguiente figura representa el registro de dos hechos


diferentes para un mismo profesor en un mismos semestre.

Unidad
(24604, 4700, Pregrado, DMCC, Ciencia)

(22501, 4601, Pregrado, DMCC, Ciencia)


(4, 22)

(6, 22)

(2, 2001)

Tiempo

(12112234-k, Computación, 4500)

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Un hecho es una estructura de datos formada por las coordenadas y


las medidas:

Unidad
Un hecho
(24604, 4700, Pregrado, DMCC, Ciencia)

(22501, 4601, Pregrado, DMCC, Ciencia)


(4, 22)

(6, 22)

(2, 2001)

Tiempo

(12112234-k, Computación, 4500)

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Algunas preguntas de verificación:


• ¿Nuestro diseño cumple las expectativas?
• ¿Nuestro diseño es implementable?

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Dinámica de Modelo Multidimensional

Implementación de los operadores


Operadores OLAP Básicos

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Sea H un conjunto de hechos o variable multidimensional (VM)

ℎ: 𝐸𝐷~𝐸𝐸
cuyo espacio multidimensional ED está caracterizado por un conjunto de K
dimensiones (𝐷1 , … , 𝐷𝐾 ) tales que cada dimensión consta de su propia jerarquía de
atributos:
𝐷𝑖 , 𝐽𝑖 , ∀𝑖, 𝑖 = 1, … , 𝑘

y que además consta de un espacio escalar asociado (EE ) compuesto de s medidas:

(𝑚1 , … , 𝑚𝑠 )

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

De este modo, la estructura de una variable multidimensional, la denotaremos como:

dónde, 𝐽റ representa el orden de las jerarquías de las dimensiones y 𝑚 un arreglo de


escalares (𝑚 ∈ 𝐸𝐸, 𝐸𝐸 ⊆ ℝ𝑠 ).

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Dimensión Producto
Jerarquía : Tipo → Periodo → Nombre

(J1)

𝐻 Medidas:
(toneladas, cajas)
(200.000, 20.000)

Dimensión Lugar
Jerarquía : Región → Prov → Comuna

(J3)

(2000, Nov, 21)

Dimensión Tiempo
Jerarquía : Década → Año → mes
(J2)
=( 𝐽1, 𝐽2, 𝐽3) (𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠, 𝑐𝑎𝑗𝑎𝑠 )

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Operadores OLAP

Roll-Up
Pivoting Slicing / Dicing
Drill-Down

 () = (F1(), F2(), ..., Fw() )

 () =  ( EC (  () ) )
El resultado es una nueva variable multidimensional

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Pivoting: Rotación del cubo para mirar una cara en particular.


La operación pivoting se define como una rotación (permutación) de las
dimensiones, debido a que consiste en reorganizar la disposición de las
dimensiones en función de un punto de vista.
𝐻′ = 𝑃𝐾 𝐻
𝑃𝑘 representa la acción de permutar de posición el conjunto de K dimensiones. Así,
𝐻 ′ será una nueva V.M. de k dimensiones permutadas.
𝐻′ = 𝑃𝐾 (𝐻)
es decir, nueva variable será:
𝐻 ′ = 𝐽′, 𝑚
𝐽′ representa a las dimensiones permutadas de H.

H y H’ son compatibles.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Por ejemplo:
𝐻 = ( 𝐽1, 𝐽2, 𝐽3) (𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠, 𝑐𝑎𝑗𝑎𝑠 )
𝐻 ′ = 𝑃 𝐽1,𝐽2,𝐽3 𝐻
= ( 𝐽2, 𝐽3, 𝐽1), (𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠, 𝑐𝑎𝑗𝑎𝑠 )

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Roll-Up: Produce una mayor agregación, quitando dimensiones o jerarquías.


Se define como una agregación, debido a que consiste en sumarizar la
información, en función de los atributos subyacentes al punto de vista elegido. El
punto de vista se representa a través de espacios de clasificación, constituidos
por proyecciones sobre las jerarquías de las dimensiones.

Φ Π(𝐸𝑛𝑜𝑚𝑖 ) 𝐻 = Ϝ(𝐸𝐶( 𝐻 )

Π(𝐸𝑛𝑜𝑚𝑗 )

Donde
𝐸𝐶 = ς𝑘𝑗=1 𝑃𝐼( 𝐸𝑛𝑜𝑚𝑗 )
EC está constituido por un producto cartesiano de proyecciones Intervaladas
definidas sobre los atributos de las dimensiones y F es una función de agregación
que actúa sobre las medidas de las tuplas pertenecientes a cada casilla generada.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Suponga ahora que se tiene una VMD H con una soma dimensión y una jerarquía de
atributos Categoría → Trimestre y se requiere analizar la información solo en función
de la categoría.
Entonces, se realizará la siguiente operación, que reagrupará los hechos de H
solamente en función de la categoría, sumarizando los valores de las ventas a través
de la función de agregación F :

𝑃𝐼𝐼 𝐶𝑎𝑡𝑒𝑔𝑜𝑟í𝑎

ΦΠ(𝐶𝑎𝑡𝑒𝑔𝑜𝑟í𝑎) 𝐻 = Ϝ 𝐸𝐶( 𝐻 )
= 𝐹(𝑃𝐼𝐼 𝐶𝑎𝑡𝑒𝑔𝑜𝑟í𝑎 ( 𝐻 ))

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Slicing-Dicing: Seleccionar un subconjunto del cubo (rebanar).


La operación slicing-dicing es una selección que actúa en función de valores
específicos de los atributos de una dimensión:

𝜎𝜌(𝐸𝑛𝑜𝑚 ) 𝐻
𝑖

𝜌 𝐸𝑛𝑜𝑚𝑖 es una expresión condicional definida sobre los atributos de una


dimensión.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

La siguiente operación seleccionará los hechos del cubo tales que el valor del
atributo almacén es “Store1” y el valor del atributo productos es “Electronics” o
“Toys”
𝜎 𝐴𝑙𝑚𝑎𝑐𝑒𝑛="𝑆𝑡𝑜𝑟𝑒1" 𝐻
∧ 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠 ∈ {𝐸𝑙𝑒𝑐𝑡𝑟𝑜𝑛𝑖𝑐𝑠,𝑇𝑜𝑦𝑠}

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Drill-Down: Produce mayor desagregación al agregar dimensiones o al agregar


atributos en las jerarquías.
Se define como una desagregación, debido a que consiste en descomponer las
medidas sumarizadas, para obtener un cubo con más dimensiones y/o jerarquías más
grandes, y hechos.
Φ(𝐸𝑛𝑜𝑚𝑖 ‫𝐸 ڂ‬′𝑖 ) 𝐻 = Ϝ(𝐸𝐶( 𝐻 )

(𝐸𝑛𝑜𝑚𝑖 ‫𝐸 ڂ‬′𝑖 )
Dónde:
𝐸𝐶 = ෑ 𝑃𝐼( 𝐸𝑛𝑜𝑚𝑖 ‫) 𝑖𝑆𝐸ڂ‬
𝑗∈𝑄

Como antes, F es una función que actúa sobre las medidas de las tuplas
pertenecientes a cada casilla generada.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

ΦΠ({𝐶𝑎𝑡𝑒𝑔𝑜𝑟í𝑎,𝑇𝑟𝑖𝑚𝑒𝑠𝑡𝑟𝑒}∪{𝑚𝑒𝑠}) 𝐻 = Ϝ 𝐸𝐶 𝐻

Con 𝐸𝐶 = 𝑃𝐼𝐼 𝐶𝑎𝑡𝑒𝑔𝑜𝑟í𝑎 × 𝑃𝐼𝐼(𝑇𝑟𝑖𝑚𝑒𝑠𝑡𝑟𝑒) × 𝑃𝐼𝐼(𝑀𝑒𝑠)


La operación anterior agrega el atributo mes sobre la jerarquía.

La figura muestra el efecto


que la operación tienen sobre
un hecho en particular (*),
no obstante, lo mismo
sucede con cada uno de los
hechos de H.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Ejemplo:
Suponga que se tiene el siguiente hecho con una única dimensión y se desea
agrupar los datos por décadas (a partir de la edad) y por la escolaridad.

N º Obs Escolaridad Edad Sexo Estatura Peso


1 Básica 18 M 162 65
2 Básica 22 F 155 58
3 Básica 19 F 175 68
4 Básica 20 F 158 70
5 Media 20 F 170 72
Atributos de 6 Media 19 M 172 68
jerarquías 7 Media 20 M 160 60 Medidas
(para 8 Media 22 M 166 75 (indicadores)
dimensiones) 9 Universitaria 27 F 155 50
10 Universitaria 28 M 170 75
11 Universitaria 26 F 165 65
12 Universitaria 27 M 166 60

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Dimensión Persona: Conjunto de medidas:

N°Obs → Escolaridad → Sexo { Edad, Estatura, Peso }

Medidas:
(Edad, Estatura, Peso)

(22, 170, 65)


(35, Media, Femenino)

Dimensión Persona (J1):


Jerarquía : N°Obs → Escolaridad → Sexo

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Se desea agrupar los datos por décadas (a partir de la edad) y por


la escolaridad:

Será necesario utilizar dos proyecciones intervaladas, una que transforme la


edad en décadas y la otra que tome la escolaridad, tal cual.
• g(x) = [edad(x)/10]+1
• h(x) = escolaridad(x)
g() transforma el dominio de edad en clases. Si el dominio de edad es
{0,1,2,3, …., 99}
Generará el conjunto
{ 1, 2, 3, 4, …, 10 }
Donde cada clase k representa un intervalo de diez años.
Por otra parte, h() es una PII.

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Así, tenemos que:

EC = g(Dom(edad)) X h(Dom(escolaridad))
= {1,2, …, 10} X {Básica, Media, Universitaria}
= { (1,Básica), (1,Media), (1,Univerversitaria),


(10,Básica), (10,Media), (10,Univerversitaria) }

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Y al clasificar los datos de la tabla, obtendremos:

década escolaridad casilla

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Ejemplo:

Suponga que se define la función de tabulación:


 ( ) =  ( EC () )
Sobre la relación  cuyo esquema es:
{ NºObs, Escolaridad, Edad, Sexo, Estatura, Peso }
Donde el espacio de clasificación EC está constituido por las funciones:
• g(x) = [edad(x)/10]+1
• h(x) = escolaridad(x)
Lo que implica que:
EC = g(Dom(edad)) X h(Dom(escolaridad))
= {1,2, …, 10} X {Básica, Media, Universitaria}

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

Y la función de agregación múltiple esta definida por la siguientes funciones de


agregación simple:
• f1(x) = 1
• f2(x) = edad(x)
• f3(x) = estatura(x)
Es decir:
 () = ( F1(), F1(), F1() )
Al aplicarla sobre la relación:

N º Obs Escolaridad Edad Sexo Estatura Peso


1 Básica 18 M 162 65
2 Básica 22 F 155 58
3 Básica 19 F 175 68
4 Básica 20 F 158 70
5 Media 20 F 170 72
6 Media 19 M 172 68
7 Media 20 M 160 60
8 Media 22 M 166 75
9 Universitaria 27 F 155 50
10 Universitaria 28 M 170 75
11 Universitaria 26 F 165 65
12 Universitaria 27 M 166 60

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V


Modelamiento Multidimensional

sumatorias
Se obtiene:
década escolaridad cardinalidad estatura peso

Origina una nueva dimensión Estudios: Década → Escolaridad


Las medidas resultantes son: ( f1, f2, f3 )

Modelamiento de Bases de Datos Científicos Profesor Fredi Palominos V

También podría gustarte