Está en la página 1de 25

UNIVERSIDAD TÉCNICA DE MANABÍ

DEPARTAMENTO DE INFORMÁTICA

Administración de Base
de Datos

Tercer Semestre
Ing. Lorena Bowen Mendoza
Administración de Bases de Datos

Contenido a tratar hoy:


Planificación de la Base de Datos
Diseño Físico de la Base de Datos
Eficiencia y Afinación de Bases de Datos

Objetivo de la Clase:
✓Apreciar las dificultades de realizar un diseño físico de
bases de datos y la necesidad de revisiones periódicas a
las opciones del diseño físico de bases de datos.
✓Enlistar las siguientes características de las estructuras
de archivos: secuencial, Btree, hash y bitmap.

Cognitive Cities Management Research Group (CMMA) 2


Administración de Bases de Datos

PLANIFICACION DE LA BASE DE DATOS

Distribuir la
Proceso de
información en Determinar el propósito
planificación y diseño
diferentes tablas final del proyecto
previo
vinculadas entre sí

Realizar un esquema en
Establecer prioridades y
papel anotando los
enumerar las
datos que queremos
funcionalidades
utilizar y las tareas que
principales
deseamos que realice

Cognitive Cities Management Research Group (CMMA) 3


Administración de Bases de Datos

Fases de Diseño
El diseño de una base de datos se realiza en dos niveles. El primero es el nivel
conceptual, en la cual se contempla una estructura abstracta y no
implementable directamente con un SGBD. El segundo es el nivel físico, en el
cual la base de datos es ya implementable.
Las fases de diseño de una base de datos son:
1. Análisis de Requerimientos: Descripción operacional en un lenguaje
natural; se realiza la fase de adquisición de conocimiento:
a) Entrevista con los usuarios del sistema.
b) Identifica necesidades.
c) Asegurar que se tenga los datos necesarios para las funciones y aplicaciones donde
se usará la base de datos.
La salida son los requerimientos del sistema.
Cognitive Cities Management Research Group (CMMA) 4
Administración de Bases de Datos
2. Diseño Conceptual: Trata de reflejar cómo son los datos, de manera
participativa y con refinamientos sucesivos a través de la interacción de
los diseñadores y usuarios del sistema. Intenta crear un Modelo Parcial
del Universo donde se trata de capturar lo suficiente para poder
soportar todas las funciones a las que servirá el sistema final. Identifica
entidades y sus relaciones. La salida es un esquema de la base de datos
utilizando el modelo Entidad/Relación.

Cognitive Cities Management Research Group (CMMA) 5


Administración de Bases de Datos
3. Diseño Lógico: Diseño que se acerca más a la implementación en un
Sistema manejador de Base de Datos. Transforma el modelo Entidad-
Relación en tablas que podrán ser implementadas en un sistema
manejador de base de datos en particular. El modelo que se puede usar
es el ELKA (Entity Link Key Attribute).

Cognitive Cities Management Research Group (CMMA) 6


Administración de Bases de Datos
4. Normalización: Elimina ciertas anomalías debidas a la redundancia y
diversos defectos del diseño de tablas utilizando las restricciones o
dependencias entre las columnas.

Cognitive Cities Management Research Group (CMMA) 7


Administración de Bases de Datos
5. Diseño Físico: Decide la estructura de almacenamiento y las estrategias
de acceso:
a) Estructura de almacenamiento: como almacenar los datos, archivos planos,
comprimidos, codificados, formatos específicos.
b) Estrategia de acceso: acceso secuencial, acceso binario.
c) Selecciona los tipos de datos.

6. Optimización: Según el criterio de almacenamiento interno, como el


espacio en disco y el tiempo medio de acceso.
Cognitive Cities Management Research Group (CMMA) 8
Administración de Bases de Datos

Cognitive Cities Management Research Group (CMMA) 9


Administración de Bases de Datos

DISEÑO FÍSICO DE BASES DE DATOS Caracterís


ticas de
las
estructura
s de
Entradas archivos

Proceso de Recuperación y Decisiones sobre


Salidas actualización de la optimización de
diseño físico las aplicaciones consultas

Objetivos
Proporcio
nar las
entradas
Las decisiones en la fase del diseño físico de bases de datos involucran detalladas
el nivel de almacenamiento de una base de datos.
A las decisiones sobre el nivel de almacenamiento se les conoce como
el esquema interno. Cognitive Cities Management Research Group (CMMA) 10
Diseño físico de Bases de Datos
Almacenamiento de las Bases de Datos
En el nivel de almacenamiento, una base de datos está Un registro físico es un conjunto de bytes que se
formada de registros físicos organizados en archivos. transfieren entre el almacenamiento volátil de la
memoria principal y el almacenamiento fijo de un
disco

Un archivo es un conjunto de registros físicos


organizados para conseguir un acceso eficiente.

Generalmente, un registro físico contiene varios


registros lógicos. El tamaño de un registro físico es
una potencia del número dos, tal como 1 024 (210)
Relaciones entre los registros lógicos (LR) y los registros físicos (PR). o 4 096 (212) bytes.

Cognitive Cities Management Research Group (CMMA) 11


Diseño físico de Bases de Datos
El DBMS y el sistema operativo trabajan de manera conjunta para satisfacer las solicitudes de
registros lógicos hechas por las aplicaciones. El DBMS y la aplicación tienen áreas de memoria
separadas conocidas como búfers.
En el caso de una operación de lectura, el sistema
operativo transfiere el registro físico del disco al área de
memoria del DBMS. Después el DBMS transfiere el
registro lógico al búfer de la aplicación. El proceso de
transferencia se invierte en el caso de una operación de
escritura.

Un requerimiento de registro lógico puede no resultar en


una transferencia de registro físico debido al proceso
denominado buffering.
Una dificultad significativa acerca de la predicción del
desempeño de la base de datos es conocer cuándo una
solicitud de registro lógico conduce a una transferencia
de registro físico.
Transferencia de registros físicos.
El objetivo del diseño físico de bases de datos es minimizar los tiempos de respuesta para acceder y modificar una base
de datos. Cognitive Cities Management Research Group (CMMA) 12
Diseño físico de Bases de Datos
Estructuras de Archivos
La selección entre estructuras de archivos alternativas es una de las decisiones más importantes del diseño físico
de bases de datos.
Archivos secuenciales
El tipo más simple de estructura de archivos almacena los
registros lógicos en el orden en el que se insertaron. Los
registros lógicos nuevos se agregan después del último
registro físico del archivo. A los archivos desordenados
algunas veces se les conoce como archivos amontonados
(heap file) dada la carencia de orden.

La principal ventaja de los archivos secuenciales


desordenados es la inserción rápida. Sin embargo, cuando
Inserción de un nuevo registro lógico en un archivo
secuencial desordenado.
se borran los registros lógicos, la inserción se vuelve más
complicada
Cognitive Cities Management Research Group (CMMA) 13
Diseño físico de Bases de Datos
Archivos secuenciales
Debido a que en ocasiones es necesaria la
recuperación ordenada, se puede preferir el uso
de archivos secuenciales ordenados en lugar de
archivos secuenciales desordenados. Los registros
lógicos se acomodan en el orden de una llave,
donde ésta puede ser cualquier columna, aunque
comúnmente es la llave primaria.

La principal desventaja para ordenar los archivos


secuenciales es la baja velocidad de inserción. Los
registros algunas veces deben ser reacomodados
durante el proceso de inserción. El proceso de
reacomodo puede incluir el movimiento de
Inserción de un nuevo registro lógico en un archivo secuencial ordenado
registros lógicos entre los bloques y la
conservación de una lista ordenada de los
registros físicos.

Cognitive Cities Management Research Group (CMMA) 14


Diseño físico de Bases de Datos
Estructuras de Archivos
Archivos Hash
Los archivos hash, en contraste con los archivos secuenciales, soportan el acceso rápido a los registros mediante el valor de
la llave primaria. La idea básica detrás de los archivos hash es una función que convierta el valor de una llave en la dirección
de un registro físico. La función mod (residuo de la división) es una función hash simple.
Capacidad = 100 registros físicos. Divisor función mod = 97 (número primo
más cercano a la capacidad del archivo). Número registro físico = Función
hash + número registro físico inicial (150).

Una colisión ocurre cuando dos llaves hash


conducen al mismo registro físico.

En el procedimiento de la medida lineal, se


coloca un registro lógico en el siguiente
registro físico disponible en caso de que su
dirección original se encuentre ocupada.

Para recuperar un registro mediante su llave,


se busca primero la dirección original. Si no se
encuentra el registro en su dirección original,
Prueba lineal para el manejo de colisiones durante una operación de inserción.
se ejecuta una prueba lineal.
Cognitive Cities Management Research Group (CMMA) 15
Diseño físico de Bases de Datos Archivos Hash

Colisiones Hash dinámicos Búsqueda secuencial

Otro problema de los archivos hash es la


Remarca un problema potencial Elimina las reorganizaciones
búsqueda secuencial

Si no ocurren frecuentemente, las inserciones y El desempeño de las búsquedas no se degrada La búsqueda secuencial puede examinar registros
extracciones son muy rápidas después de muchas operaciones de inserción físicos vacíos.

El promedio de accesos a los registros físicos para


Las buenas funciones hash tienden a dispersar los
Depende que tan lleno esté un archivo. No ocurre recuperar un registro puede ser ligeramente más
registros lógicos de forma uniforme entre los
< 70% alto cuando se compara con un archivo hash
registros físicos.
estático que no esté lleno

Si el archivo hash se llena demasiado, es El tamaño del archivo hash crezca conforme se
necesario hacer una reorganización. inserten registros

Cognitive Cities Management Research Group (CMMA) 16


Diseño físico de Bases de Datos
Estructuras de Archivos
Archivos de árbol multiforme (Btrees)
El árbol multiforme o Btree proporciona buen desempeño tanto en búsquedas secuenciales como con llaves. Un árbol es
una estructura en la cual cada nodo tiene cuando mucho sólo a una madre, a excepción del nodo raíz o nodo superior.

Todos los nodos hoja (nodos que no tienen hijos)

Características
Balanceado
residen en el mismo nivel del árbol.

El número de ramas de un nodo es grande, tal


Tupido vez entre 50 y 200 ramas. Multiforme, con más
de dos, es un sinónimo de arbusto.

Cada nodo es un bloque o un registro físico. Para buscar


Orientado a bloques se comienza en la raíz y se sigue una ruta hasta el nodo
hoja que contenga los datos que le interesan

La forma cambia mientras se insertan y borran


Dinámico registros lógicos. Nunca es necesario hacer una
reorganización periódica para un Btree.
Estructura de un Btree de nivel 3

Ubicuo El Btree es una estructura de archivos


ampliamente implementada y usada
Cognitive Cities Management Research Group (CMMA) 17
Diseño físico de Bases de Datos Archivos de árbol multiforme (Btrees)
Contenidos de un Nodo
Cada nodo está formado por pares con un valor llave y un apuntador (dirección física del registro), ordenados
por el valor de la llave.
Cada nodo está formado por pares con un valor
llave y un apuntador (dirección física del
registro), ordenados por el valor de la llave.

El apuntador identifica el registro físico que


contiene el registro lógico con el valor de la llave.

Los otros datos pueden almacenarse en registros


físicos separados o en los nodos hoja.

Nodo Btree con llaves y apuntadores Una propiedad importante de un Btree es que
El tamaño del registro físico es de 1 024 bytes, el tamaño de la llave es cada nodo, excepto la raíz, debe estar lleno por lo
de 4 bytes y el tamaño del apuntador de 4 bytes; la máxima menos hasta la mitad.
capacidad de un nodo es de 128 pares <llave, apuntador>.
Cognitive Cities Management Research Group (CMMA) 18
Diseño físico de Bases de Datos
Estructuras de Archivos
Índices Bitmap
Es una estructura secundaria de archivos consistente en
un valor de columna y un bitmap. Un bitmap contiene una
posición de bit para cada fila de la tabla referenciada. Un
índice de columna bitmap hace referencia a las filas que
contienen el valor de la columna.
Los índices bitmap funcionan correctamente para
columnas estables con algunos valores típicos de tablas en
un almacén de datos.

Los índices Bitmap son aconsejables en situaciones en


que los diferentes valores que puede tomar la columna
son relativamente pocos. Ejemplos: sexo, estado civil,
etc. Cuantos menos valores posibles, mejor. A medida
que crece la cantidad de valores posibles, aumentara el
Un índice bitmap de enlace hace referencia a las filas de una tamaño del índice.
tabla hija que se une con filas de la tabla madre contenidas en
la columna.

Cognitive Cities Management Research Group (CMMA) 19


Diseño físico de Bases de Datos
Resumen de Estructuras de Archivos

Los archivos hash se pueden usar para accesos


Los archivos secuenciales ordenados y desordenados deben secuenciales, pero quizá existan registros físicos
examinar el promedio de la mitad de los registros físicos (lineal). adicionales debido a que las llaves se encuentren
esparcidas entre los registros físicos.

Un índice bitmap soporta las búsquedas de rangos Los Btrees tienen costos de búsqueda
realizando operaciones de enlace en los bitmaps para cada logarítmicos, dada la relación entre la altura, la
valor de columna dentro del rango. función de registro y las fórmulas de costo de
búsquedas.

Cognitive Cities Management Research Group (CMMA) 20


Eficiencia y Afinación de Bases de Datos
METODOLOGÍA DE DISEÑO FÍSICO PARA BASES DE DATOS
RELACIONALES
Las bases de datos han evolucionado y con ello la gestión y afinación de las
misma, esto implica que el desarrollador debe tener en cuenta parámetros que
no solo optimicen las bases de datos como tal, sino que estos parámetros de
configuración este predispuestos al cambio y al crecimiento.

Para este proceso se consideran a los sistemas de gestores de bases de datos


(SGBD) cuyo principal objetivo es proporcionar una forma de almacenar y
recuperar la información de manera que sea tanto práctica como eficiente.

Cognitive Cities Management Research Group (CMMA) 21


Eficiencia y Afinación de Bases de Datos

Traducir
El objetivo de esta etapa es
producir una descripción
el • La primera fase del diseño lógico
consiste en traducir el esquema lógico
de la implementación de la esquema global en un esquema que se pueda
implementar en el SGBD escogido.
base de datos en memoria
secundaria.
lógico Para ello, es necesario conocer toda la
funcionalidad que éste ofrece.
global

Cognitive Cities Management Research Group (CMMA) 22


Eficiencia y Afinación de Bases de Datos

Diseñar las
relaciones base • Las relaciones base se definen mediante el lenguaje de
definición de datos del SGBD, utilizando la información
para el SGBD producida durante el diseño lógico: el esquema lógico
global y el diccionario de datos.
específico

Diseñar las • Las actualizaciones que se realizan sobre las relaciones de


reglas de la bases de datos deben observar ciertas restricciones
que imponen las reglas de negocio de la empresa.
negocio para el Algunos SGBD proporcionan mecanismos que permiten
definir estas restricciones y vigilan que no se violen
SGBD específico
Cognitive Cities Management Research Group (CMMA) 23
Eficiencia y Afinación de Bases de Datos
Es el número de transacciones que se quiere procesar en un intervalo
Productividad de de tiempo. Tiempo de Respuesta. Es el tiempo que tarda en
Transacciones ejecutarse una transacción. Espacio en disco. Es la cantidad de
Diseñar la representación
espacio en disco que hace falta para los ficheros de la base de datos.

Cada transacción hay que especificar: La frecuencia con que se va a


Analizar las Transacciones ejecutar. Las relaciones y los atributos a los que accede la transacción,
y el tipo de acceso: consulta, inserción, modificación o eliminación.

Construir índice sobre la clave primaria. No crear índices sobre las


física

Escoger los índices relaciones pequeñas. Añadir índice sobre los atributos que se utilizan
secundarios para acceder con mayor frecuencia. Añadir índice sobre las claves
ajenas. Evitar los índices sobre atributos que se modifican a menudo.

Considerar la introducción Es ocasiones puede ser conveniente relajar las reglas de


de redundancias normalización introduciendo redundancia de forma controlada, con
controladas objeto de mejorar las prestaciones del sistema.

Al adquirir nuevo equipamiento informático, el diseñador debe


Estimar la necesidad de
estimar el espacio en disco para la base de datos. Esta estimación
espacio en disco depende del SGBD que se vaya a utilizar y del hardware.
Cognitive Cities Management Research Group (CMMA) 24
Eficiencia y Afinación de Bases de Datos
• Los datos constituyen un recurso esencial para la empresa, por lo tanto su
Diseñar los mecanismos seguridad es de vital importancia. Durante el diseño lógico se habrán
especificado los requerimientos de seguridad que se debe implementar. El
de seguridad diseñador debe conocer las posibilidades que ofrece el SGBD que se vaya a
utilizar.

• El objetivo es diseñar las vistas de los usuarios correspondientes a los esquemas


Diseñar las vistas de los lógicos locales. Las vistas, además de preservar la seguridad, mejorar la
independencia de datos, reducen la complejidad y permiten que los usuarios
usuarios vean los datos en el formato deseado.

• El DBA asigna a cada usuario un identificador que tendrá una palabra secreta
Diseñar las reglas de asociada por motivos de seguridad. Para cada usuario o grupos de usuarios se
otorgarán permisos para realizar determinadas acciones sobre determinados
acceso objetos de la base de datos.

• Una vez implementado el esquema físico de la base de datos, se debe poner en


Monitorizar y afinar el marcha para observar sus prestaciones. Si éstas no son las deseadas, el
esquema deberá cambiar para intentar satisfacerlas. Los SGBD proporcionan
sistema herramientas para monitorizar el sistema mientras está en funcionamiento.

Cognitive Cities Management Research Group (CMMA) 25

También podría gustarte