Modelo Fisico

UNIVERSIDAD LOS ÁNGELES DE CHIMBOTE
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERIA DE SISTEMAS
INTELIGENCIA DE NEGOCIOS
Modelo Fisico
Universidad Los Ángeles de Chimbote
Tabla de Contenido
• Modelo Físico
▫ Modelo dimensional  Modelo Físico
▫ Dimensionamiento de la BD
▫ Estrategia de indexación.
▫ Estrategia de particionamiento.
▫ Actualización de la metadata
• MOLAP, ROLAP, HOLAP
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Objetivos
Después de completar esta lección, comprenderá:
 Trasladar el modelo dimensional a un modelo
físico.
 Explicar varias técnicas de dimensionamiento.
 Describir las técnicas de indexación para data
warehousing.
 Discutir las estrategias de almacenamiento de
tablas e índices.
 Discutir las opciones de particionamiento.
 Actualizar el documento de meta data con la
información del modelo físico.
MODELO FÍSICO
El modelo físico
• El modelo físico reside en un (RDBMS), por lo que
es necesario asegurar:
▫ Que el almacenamiento de cada objeto (tablas) se soporte
de manera apropiada y contenga los índices necesarios.
▫ El desempeño de la base de datos.
▫ El particionamiento de la base de datos.
• Trasladar el modelo dimensional al modelo físico.
• Usar estándares de nombres, adicionar formato a
los atributos, medir el desempeño de la BD y
plantear las estrategias de indexación y
particionamiento.

Checklist del Modelo Físico

1. Trasladar el modelo dimensional a un modelo físico
▫ Aplicar estándares de nombramiento y BD.
▫ Identificar el formato y longitud de columnas.
▫ Etiquetar atributos como Not Null (*) o Null (o)
2. Desarrollar el dimensionamiento de la BD.
3. Definir la estrategia de indexación inicial.
4. Definir la estrategia de almacenamiento de
tablas/índices.
▫ Definir la estrategia de particionamiento.
5. Actualizar el documento de la meta data.
Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento

TRASLADAR EL MODELO
DIMENSIONAL AL MODELO
FÍSICO
Dimensio- Indexació Almace-

MD  MF Meta data
namiento n namiento
Estándares para nombres de objetos

• Mantener los nombre lógicos y físicos similares.
• Encontrar un balance entre nombres específicos y
vagos.
• Nombre de tablas y atributos en mayúscula.
• Utilizar subrayado para separar palabras.
• Utilizar el sufijo _ID para indicar llaves producción.
• Utilizar el sufijo _KEY para indicar llave primaria.
• Desarrollar una lista razonable de abreviaciones.
• Listar todos los nombres de los objetos y trabajar
con la comunidad de usuarios para definirlos.
• Resolver las disputas de nombres.
• Documentar estándares de nombres en un
documento.
Modelo Dimensional  Modelo Físico

• Listar las columnas de una tabla con las columnas claves
primarias al inicio.
Etiquetas:
• Las claves primarias con un PK y (* #)
• Las llaves únicas con un (#)
• Las columnas con restricciones NULL (o) o NOT NULL
(*).
• Las llaves foráneas con una FK y (* #) si es parte de la
llave primaria (PK).
• Identificar el formato y longitud de las columnas.
▫ d para decimales
▫ n para numéricos
▫ c para caracteres
▫ v para carácter variables
▫ date para fecha
Ejercicio 1
• Trasladar el modelo dimensional lógico a un
modelo dimensional físico.
• Aplicar los estándares propuestos.

Ejercicio 1 – Modelo dimensional lógico

Day Key (PK) Product Key (PK)
Day ID Product ID
Day Desc Product Desc
Weekend Category Key
Holiday Eve Category ID
Holiday Day Category Desc
Holiday Wknd Day Type Key
Month Key Type ID
Month ID Type Desc
Month Desc Rentals Fact Status
Year Key Age Classification
Year ID Day Key (FK)
Rental Period
Year Desc Customer Key (FK)
Sold Out rating
Time Band Product Key (FK)
Daily Rate
Store Key (FK)
Customer Key (PK)
Store Key (PK)
Customer ID Number of Rentals
Store ID
Customer Name Rental Amount
Store Desc
Status Rental Cost
Location
Geog. proximity Profit
Size
Activity level
Type
Type pref.
District Key
Movie category pref.
District ID
Movie age pref.
District Desc
Movie rate pref. Game
Region Key
category pref.
Region ID
Game age pref.
Region Desc
Game rate pref.

Ejercicio 1 - Modelo dimensional físico

# * DAY_KEY (PK) n # * PRODUCT_KEY (PK) n
* DAY_ID date * PRODUCT_ID v(11)

* DAY_DESC v(9) * PRODUCT_DESC v(125)
* WEEKEND v * CATEGORY_KEY n
* HOLIDAY_EVE v * CATEGORY_ID v(20)
* HOLIDAY_DAY v * CATEGORY_DESC v(25)
* HOLIDAY_WKND_DAY v * TYPE_KEY n
* MONTH_KEY n * TYPE_ID v(20)
* MONTH_ID n Rentals Fact * TYPE_DESC v(15)
* MONTH_DESC v(9) * STATUS v(15)
* YEAR_KEY n # * DAY KEY (FK) n * AGE n
* YEAR_ID n * CLASSIFICATION v(25)
# * CUSTOMER KEY (FK) n
* YEAR_DESC v(9) * RENTAL_PERIOD n
# * PRODUCT KEY (FK) n
* TIME_ BAND v(2) * SOLD_OUT_RATING v
# * STORE KEY (FK) n * DAILY_RATE n
# * CUSTOMER_KEY (PK) n
* RENTALS_NUMBER d
# CUSTOMER_ID v(25) * RENTAL_AMOUNT d # * STORE_KEY (PK) n
* CUSTOMER_NAME v(50) * RENTAL_COST d
* STATUS v * PROFIT d * STORE_ID v
* GEOG_PROXIMITY n * STORE_DESC v
* ACTIVITY_LEVEL v * LOCATION v(50)
* TYPE_PREF v(20) * SIZE n
* MOVIE_CAT_PREF v(20) * TYPE v(15)
* MOVIE_AGE_PREF v(20) * DISTRICT_KEY n
* MOVIE_RATE_PREF v(20) * DISTRICT_ID n
* GAME_CAT_PREF v(20) * DISTRICT_DESC v(50)
* GAME_AGE_PREF v(20) * REGION_KEY n
* GAME_RATE_PREF v(20) * REGION_ID n
* REGION_DESC v(50)

DIMENSIONAMIENTO DE LA BASE
DE DATOS
Dimensio- Almace-
namiento namiento
Dimensionar Base de Datos

• Calcular el tamaño físico de la base de datos.
• Espacio en disco para almacenar:
▫ Tablas, vistas, indices.
• El dimensionamiento es requerido para:
▫ La arquitectura del medio ambiente.
▫ Tareas de backup y recuperación.
▫ Técnicas de BD espejos
▫ Espacio temporal y técnicas de carga de datos.
• Dimensionamiento no es una ciencia, existen
varias técnicas

Estimar el tamaño de la Base de Datos

• Estimar el tamaño de fila de la tabla hechos.
• Estimar el nro. filas de la tabla de hechos:
▫ Determinar la granularidad de cada dimensión.
▫ Estimar el número de entradas en el nivel mas
fino.
▫ Multiplicar el número de filas de c/dimensión.
• Tamaño BD = tamaño de fila * nro. filas.
• Estimar la reducción o incremento en el tamaño
según el grado de dispersión.
▫ Baja dispersiónrestar entre el 5% al 10%
▫ Media dispersión restar entre el 10% al 25%
▫ Alta dispersión restar entre el 25% al 50%
Estimar el tamaño de la Base de Datos

Tamaño Tamaño Nro de
BD
= ( de la fila
*
filas )- Dispersión
• Tamaño fila = Σ tamaño columnas.
• Nro de filas = estimación de transacciones por

año
• Dispersión = Es el % de dispersión de los datos.

Ejercicio 2
• Calcular el tamaño de la tabla de
hechos para el ejemplo propuesto.
• El horizonte es de 3 años, asuma # * DAY KEY (FK)

# * CUSTOMER KEY (FK)
n
n
# * PRODUCT KEY (FK) n
una dispersión del 10% (baja # * STORE KEY (FK) n
dispersión) *
*
RENTALS_NUMBER
RENTAL_AMOUNT
d
d
* RENTAL_COST d
* PROFIT d

Ejercicio 2 – método 1
Descripción Fórmula Valor Comentario
Tamaño de una fila de la tabla hechos 16*4+4*4 80 asumido para este ejemplo
Estimar el número de entradas en el nivel mas bajo para cada dimensión

DAY KEY (FK) n 3*365 1095 3 años (48 meses)
CUSTOMER KEY (FK) n 65 65 clientes
PRODUCT KEY (FK) n 36 36 ítems
STORE KEY (FK) n 4 3 canales
Número de entradas 10,249,200
nro de entradas de cada dimensión X 10,249,200 * 80 819,936,000

tamaño fila tabla hechos
Dispersión 0.1*819,936,000 81,993,600 Si es baja se asumen 10%
Tamaño estimado BD 0.9*819,936,000 737,942,401 737.9 MB

Ejercicio 2 – método 2
Descripción fórmula valor unidades
Ingresos totales de la empresa 2000 billones X año
Precio promedio venta por línea de ítem 50 $
Línea ítems por año 200 billones/$50 4 Billones

Registros en 3 años 4 billones×3 años 12 billones
Tamaño de registro 80 Bytes
Tamaño tabla hecho base 12 billiones* 80 bytes = 960,000,000,000

960 GB

ESTRATEGIA DE INDEXACIÓN
DE DATOS
Dimensio- Almace-
namiento namiento
Índices
• Los índices son objetos de la bases de datos,
cuya función es optimizar el acceso a datos.
• A medida que las tablas se van haciendo más

grandes y se desea hacer consultar sobre estas
tablas, los índices son indispensables.

Índices
• Internamente un índice normal es una estructura de árbol,
que cuenta con una página principal y luego esta con
paginas hijas, que a su vez tiene más paginas hijas hasta
llegar a la pagina final del índice (leaf level).
Hoja de páginas
• La clave del índice está repartida en las páginas del índice,
de modo tal que la búsqueda se haga leyendo la menor
cantidad posible de datos.

Tipos de Índices
• Índice no agrupado
▫ El orden físico de las filas es independiente del orden
indizado
CREATE NONCLUSTERED INDEX IX_SalesPerson_SalesQuota_SalesYTD

ON Sales.SalesPerson (SalesQuota, SalesYTD);
• Indice agrupado.
▫ El orden lógico de los valores de clave determina el orden físico de
las filas correspondientes de la tabla.
▫ El nivel inferior u hoja, de un índice agrupado contiene las filas de
datos en sí de la tabla.
▫ Una tabla o vista permite un índice agrupado al mismo tiempo.
CREATE INDEX IX_ProductVendor_VendorID ON

Purchasing.ProductVendor (VendorID, SalesQuota, ),;

índice no agrupado
• Almacena, por cada elemento del índice, un
"identificador" para encontrar en la tabla los datos
asociados a este. RID
• Cuando el DBMS utiliza el índice y determina que

debe ir a buscar los datos, utiliza ese
"identificador" para ubicar los datos en la tabla.
• En este caso el identificador utilizado es el RID
(row id)
• RID está conformado por:
▫ el numero del archivo de la base de datos
▫ el número de la página dentro de ese archivo.
▫ el número de la fila en la página.
Índice Agrupado
• El “identificador” utilizado es la llave del índice
agrupado.
• La llave del índice agrupado está conformado por:

▫ Todas las columnas del índice agrupado.
• No confundir la llave del índice con la llave

primaria de una tabla, aunque muchas veces
tienen el mismo "valor," en especial cuando la
tabla se creó sin darle mayor importancia a este
tema.

Búsqueda con índice

• También se denomina LookUp
• Realiza una operación de búsqueda, con un

"identificador" de una fila, para traer más
información, de la fila específica, desde la tabla.
▫ Índice agrupado. Utiliza el RID.
▫ Índice no agrupado. Utiliza la llave del índice agrupado.

Búsqueda con índices

Índice no agrupado.
• Se usa el RID.
• Se identifica las filas que
cumplen con la condición de
filtrado.
• Resultado: Celdas amarillas.
Índice agrupado.
• Se usan los tres identificadores
de filas (rojo, verde y azul).
• Se realiza la operación de
búsqueda en el índice agrupado.
• Se identifica las filas que
cumplan los tres
identificadores.

Índice agrupado vs no agrupado

• Índice non-clustered, la clave tiene un puntero a la
página de datos donde se encuentra el registro.
• Índice clustered, la leaf level es la pagina de datos.
(se ahorra un salto para leer los datos del registro)
• La diferencia es importante, ya que el uso de este
tipo de índices al evitar tener que hacer lecturas
adicionales para traer el registro.

Índice único
• Dos filas no pueden tener = valor de clave del índice.
• Las columnas utilizadas deben establecerse en NOT NULL
(dado los valores nulos se consideran duplicados)
• No se admite la creación de un índice único sobre columnas
que ya contengan valores duplicados, independientemente
de si se ha establecido o no IGNORE_DUP_KEY en ON.
CREATE UNIQUE INDEX AK_UnitMeasure_Name ON
Production.UnitMeasure(Name);
CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH

(IGNORE_DUP_KEY = ON);
CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH

(IGNORE_DUP_KEY = OFF);

Estrategias
• Un DBMS optimiza una consulta usando dos
enfoques:
• Optimización basada en reglas

▫ rule-based optimization (RBO)
▫ Que consiste en usar índices siempre.
• Optimización basada en costos

▫ cost-based optimization (CBO)
▫ El cuál determina si usar un índice es apropiado

Tipos de índices
 Índices B*-tree
 Usado para pequeño número de valores distintos en una
columna
 Índices Bitmap
 Usado con el enfoque CBO.
 Se crea un índice para cada clave foránea.
 Índices Particionados
 Se denomina índices localizados, colocándose el índice
en un partición determinada.
 Tablas organizadas por índice.
 En este tipo de índice la data esta sostenida en el índice,
cambios en los datos solo representa cambios en el
índice.

Estrategias de indexación
size = ‘SMALL’
’ 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1
size = ‘MED’
’ 1 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0
size = ‘LARGE’
’ 0 1 0 1 0 0 0 0 1 0 1 0 1 0 1 0
color = ‘BLUE’ 0 1 0 1 0 0 1 0 1 0 1 0 0 0 1 0
color = ‘RED’ 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1
color = ‘GREEN’ 1 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0
Que columnas son?

Que tablas?
Que tipo de índice?

Índice B*-tree
• Es usado para pocas filas
• Los datos se organizan como un árbol.
• A la derecha están los menores a la izquierda los
mayores
• La forma de llegar a un valor es fija.
• Si los datos son: H

• ADGHPRZ
D R
A G P Z

Índice Bitmap
 Almacena valores con 1’s y 0’s
 Utilizado en lugar de índices B*-tree cuando:

 Tablas son muy grandes
 Columnas tienen una cardinalidad baja
 Múltiples columnas son restringidas en la misma
consulta.

Ejemplo índice Bitmap

CUSTOMER table
CUSTOMER# MARTIAL_STATUS REGION GENDER INCOME_LEVEL
101 single east male bracket_1
102 married central female bracket_4
103 married west female bracket_2
104 divorced west male bracket_4
105 single central female bracket_2
106 married central female bracket_3
CREATE BITMAP INDEX cust_region ON customer(region);
Ejemplo de índice bitmap en la columna REGION
REGION = ‘east’ REGION = ‘central’ REGION = ‘west’

1 0 0
0 1 0
0 0 1
0 0 1
0 1 0
0 1 0
Ejemplo índice Bitmap

SELECT COUNT(*)
FROM CUSTOMER
WHERE MARITAL_STATUS = ‘married’
AND REGION IN (‘central’, ‘west’);
status = region = region = Query

‘married’ ‘central’ ‘west’ Result
0 0 0 0 0 0
1 1 0 1 1 1
col 2
1 AND 0 OR 1 = 1 AND 1 = 1
0 0 1 0 1 0
col 3
0 1 0 0 1 0
1 1 0 1 1 1
col 5
ESTRATEGIA DE
ALMACENAMIENTO
Dimensio- Almace-
namiento namiento
Archivos de Datos
• Controlan la asignación de espacio en el disco.
• Asigna cuotas de espacio.
• Controla la disponibilidad de datos.
• Desarrolla el respaldo y recuperación parcial de la

Base de Datos.
• Asigna almacenamiento de datos a través de los

dispositivos

Estructura Física de la Base de Datos

 Provee asignación automática de extensiones (extents).
 Evita asignación dinámica de extensiones (extents).
Segmento
148KB
Extent Extent
Base de Datos 36KB 112KB
tablespace tablespace
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB

Evitando la Fragmentación
• Recordar actividades de carga e indexación.
• Determinar la tasa de crecimiento de la BD para no
crecer constantemente.
• Mantener suficiente espacio en el DD
Extent
50 KB
CREATE TABLE
sales_fact ... Extent
SIZE = 50KB, 50 KB
FILEGROWTH = 25KB Extent
75 KB

Consideraciones de Archivos de Datos

• Crear un archivo de datos con las características del objeto
que el va ha mantener.
• Localizar objetos grandes dentro de un archivo de datos .
• Localizar objetos con propiedades y patrones de acceso
similares juntos.
• Se puede cambiar los datos de un archivo de datos :
▫ Incrementando el numero de archivos de datos.
▫ Creando archivos de datos que puedan crecer dinámicamente
Tablespace Tablespace Tablespace
SALES SALES SALES
Tablespace Tablespace
SALES_1 SALES_2

ESTRATEGIA DE
PARTICIONAMIENTO
Dimensio- Almace-
namiento namiento
Particionamiento de índices y tablas

• Tablas grandes e índices pueden ser particionados
en piezas mas pequeñas y manejables.
Tablespace
Segment
Extent
Blocks
Estructura

Ventajas del Particionamiento

Particionamiento puede ser útil en las siguientes
áreas:
 Grandes Base de Datos (VLDBs)
 Reducción de tiempo de baja para mantenimiento
programado.
 Reducción de tiempo de baja por fallas de datos.
 Performance en Sistemas de Soporte a las
Decisiones (DSS).
 Performance de I/O
 Disk striping.
 Particionamiento transparente.

Particionamiento Horizontal
 Particionamiento de datos de tablas e índices por:
 Tiempo
 Ventas
 Geografía January 1996
 Organización February 1996
March 1996
 Línea del negocio April 1996
May 1996
June 1996
 Partición por tiempo

Particionamiento Vertical
 Partición de datos por columna (raro)
 Permite acceso a cierto grupo de usuarios.
Col A Col B Col C Col D

Particiones
• El ejemplo siguiente crea un índice no agrupado
con particiones en TransactionsPS1, un esquema
de partición existente.
• Este ejemplo asume que se ha instalado el ejemplo

de índice con particiones.
CREATE NONCLUSTERED
INDEX IX_TransactionHistory_ReferenceOrderID
ON Production.TransactionHistory (ReferenceOrderID)
ON TransactionsPS1 (TransactionDate);

ACTUALIZACIÓN DE LA META
DATA
Dimensio- Almace-
namiento namiento
Actualizando el documento de Metadata

Información del modelo Físico

Actualizando el documento de Metadata

Información del plan de indexación

ROLAP, MOLAP, HOLAP
Esquema Físico
• Existe tres formas de almacenar los datos:
AGREGACIONES
Y DATOS
Vista de
Base de Datos Usuario
Relacional
Base de Datos
Multidimensional
. MOLAP - Multidimensional OLAP.

AGREGACIONES DATOS AGREGACIONES
Y DATOS
Vista de
Vista de Relacional Base de Datos
Base de Datos Usuario Multidimensional
Relacional Base de Datos
Multidimensional
ROLAP - Relacional OLAP. HOLAP - OLAP híbrido

MOLAP - OLAP Multidimensional

• Los datos origen y sus agregaciones están en una
estructura multidimensional.
• Los objetos dimensionales son procesados para incorporar
cambios de los datos operacionales, el resumen de datos se
hace por adelantado.
• Existe latencia. tiempo comprendido entre procesamientos
• Características:
▫ Provee excelente rendimiento y compresión de datos.
▫ Mejor tiempo de respuesta, depende de las las agregaciones.
▫ Estructura optimizada para maximizar las consultas.
▫ Apropiado para cubos de rápida respuesta.
AGREGACIONES
Y DATOS
Vista de
Relacional
Base de Datos
Multidimensional

ROLAP - OLAP Relacional

• La información del cubo, sus datos, su agregación, sumas
son almacenados en una base de datos relacional.
• No copia la BD original, accede a las tablas origen.
• Es más lenta que las otras estrategias (MOLAP o HOLAP).
• Se utiliza para ahorrar espacio de almacenamiento en
grandes DB de baja frecuencia de consulta.
• Usos comunes:
▫ Cuando los clientes desean ver los cambios
inmediatamente.
▫ Cuando contamos con grandes conjuntos de datos que
no son frecuentemente buscados
AGREGACIONES
Y DATOS
Vista de
Multidimensional

HOLAP – OLAP Híbrido

• Combina atributos de MOLAP y ROLAP.
• Las agregaciones se almacenen en una estructura
multidimensional y los detalle, en la BD original.
• Cubos más pequeños q’ MOLAP y más rápidos q’
ROLAP.
• Usos comunes:
▫ Cubos que requieren rápida respuesta
▫ Cuando existen sumarizaciones basadas en una gran cantidad de datos de
origen.
▫ Solución de compromiso para bajar el espacio ocupado sin perjudicar
totalmente el rendimiento de las consultas.
DATOS AGREGACIONES
Vista de
Multidimensional

Características
MOLAP ROLAP HOLAP
Almacenamiento de Modelo Base de datos
las Agregaciones
Modelo Multidimensional
Multidimensional relacional
Almacenamiento de Modelo Base de datos
los datos
Base de datos relacional
Multidimensional relacional
Facilidad de
Creación
Sencillo Muy Sencillo Sencillo
Buena para consultas
Velocidad de que posean
respuesta
Buena Regular o Baja
agregaciones, Regular
para datos de bajo nivel
Problemas de
Escalabilidad Son más escalables
escalabilidad
Datos que no son
Recomendados Cubos con uso Si el cubo requiere una
Para
frecuentemente
frecuente rápida respuesta
usados
Ventajas y Desventajas
Ventajas Desventajas
Duplica el almacenamiento
Mejor performance en los
MOLAP tiempos de respuesta
de datos (ocupa más
espacio)
Tiempo de Latencia
Ahorra espacio de
almacenamiento.
El tiempo de respuesta a
ROLAP Útil cuando se trabaja con
consultas es mayor.
muy grandes conjuntos de
datos.
Buen tiempo de respuesta Volúmenes de datos más

HOLAP sólo para información grandes en la base de
sumarizada datos relacional

Modelo Fisico

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Modelo Fisico

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD LOS ÁNGELES DE CHIMBOTE

• MOLAP, ROLAP, HOLAP

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Checklist del Modelo Físico

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Dimensio- Indexació Almace-

Estándares para nombres de objetos

Modelo Dimensional  Modelo Físico

• Aplicar los estándares propuestos.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Ejercicio 1 – Modelo dimensional lógico

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Ejercicio 1 - Modelo dimensional físico

* DAY_ID date * PRODUCT_ID v(11)

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Dimensionar Base de Datos

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Estimar el tamaño de la Base de Datos

Estimar el tamaño de la Base de Datos

• Tamaño fila = Σ tamaño columnas.

• Nro de filas = estimación de transacciones por

• Dispersión = Es el % de dispersión de los datos.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

• El horizonte es de 3 años, asuma # * DAY KEY (FK)

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Estimar el número de entradas en el nivel mas bajo para cada dimensión

Número de entradas 10,249,200

nro de entradas de cada dimensión X 10,249,200 * 80 819,936,000

Tamaño estimado BD 0.9*819,936,000 737,942,401 737.9 MB

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Línea ítems por año 200 billones/$50 4 Billones

Tamaño de registro 80 Bytes

Tamaño tabla hecho base 12 billiones* 80 bytes = 960,000,000,000

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

• A medida que las tablas se van haciendo más

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

CREATE NONCLUSTERED INDEX IX_SalesPerson_SalesQuota_SalesYTD

CREATE INDEX IX_ProductVendor_VendorID ON

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

• Cuando el DBMS utiliza el índice y determina que

• La llave del índice agrupado está conformado por:

• No confundir la llave del índice con la llave

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Búsqueda con índice

• Realiza una operación de búsqueda, con un

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Búsqueda con índices

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Índice agrupado vs no agrupado

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH

CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

• Optimización basada en reglas

• Optimización basada en costos

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

Que columnas son?

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas

• Si los datos son: H

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas