Está en la página 1de 30

Unidad II

Objetivo:
El estudiante conocer los factores que afecta a una base de datos montada en mltiples servidores, como lo son los niveles de transparencia y la fragmentacin de datos.

Subtemas:
2.1 Diseo de bases de datos distribuidas 2.2 Diccionario de datos. 2.3 Niveles de transparencia. 2.3.1 Transparencia de localizacin. 2.3.2 Transparencia de fragmentacin. 2.3.3 Transparencia de rplica. 2.4 Fragmentacin de datos. 2.4.1 Fragmentacin horizontal. 2.4.2 Fragmentacin vertical. 2.4.3 Fragmentacin hbrida. 2.5 Consideraciones para distribuir la BD

Diseo de bases de datos distribuida


En el diseo de base de datos distribuida se debe considerar el problema de cmo distribuir la informacin entre diferentes sitios. Existen razones organizacionales las cuales determinan en gran medida lo anterior. Sin embargo, cuando se busca eficiencia en el acceso a la informacin, se deben abordar dos problemas relacionados: 1. Como fragmentar la informacin. 2. Como asignar cada fragmento entre los diferentes sitios de la red.

En el diseo de la BDD tambin es importante considerar si la informacin esta replicada, es decir, si existen copias mltiples del mismo dato y, en este caso, como mantener la consistencia de la informacin. Finalmente, una parte importante en el diseo de una BDD se refiere al manejo de directorio. Si existen nicamente usuarios globales, se debe manejar un solo directorio global. Sin embargo, si existen tambin usuarios locales, el directorio combina informacin local con informacin global.

La organizacin de los sistemas de base de datos distribuidas se puede analizar en 3 dimensiones.


Modo de acceso
Dinmico Esttico Informacin Informacin parcial total

Datos y Datos programas

Nivel conocimiento

Comparticin

Nivel de comparticin. 1. Inexistente: - Cada aplicacin y sus datos se ejecutan en una maquina sin comunicacin con otros programas o datos. 2. Comparticin de datos: - Cada maquina posee sus propias aplicaciones locales pero se comparten los datos. 3. Comparticin de datos y programas: - Las aplicaciones locales es una maquina pueden invocar servicios en otras y adems comparten los datos.

Modos de acceso.
1. Esttico : - El modelo de acceso a los datos no varia con el tiempo.

2. Dinmico:- El modelo de acceso a los datos varia con el tiempo.

Nivel de Conocimiento
1. Sin Informacin:- Los diseadores no tienen informacin de cmo acceden los usuarios a los datos.

2. Con Informacin parcial: - Los diseadores no poseen toda la informacin de cmo acceden los usuarios a los datos.
3. Con Informacin total:- Los diseadores poseen toda la informacin de cmo acceden los usuarios a los datos.

Estrategias de Diseo
Las Estrategias son las utilizadas en una BD relacional, pero aadiendo un paso de diseo de la distribucin a la hora de abordar el diseo de una Base de Datos Distribuida podremos optar principalmente por dos tipos de estrategias: 1. La estrategia ascendente ( botton up ) 2. La estrategia descendente (top - down )

La estrategia ascendente ( botton- Up)


En este caso se permitir de los esquemas conceptuales locales y se trabajara para llegar a conseguir el esquema conceptual global. Despus se pasara al diseo de distribucin. Esta estrategia suele ser utilizada para integrar varias base de datos centralizadas existentes.

La estrategia descendente ( top down)


Se parte de cero y se avanza en el desarrollo del trabajo. Los pasos a realizar mediante esta estrategia son: 1. Anlisis de requisitos. 2. Diseo de vistas 3. Diseo conceptual 4. Diseo de la distribucin. Fragmentacin Asignacin 5. Diseo fsico 6. Monitorizacin y ajuste

Diccionario de datos
Es el lugar donde se deposita informacin acerca de todos los datos que forman la BD. Es una gua en la que se describe la BD y los objetos que la forman. El diccionario contiene las caractersticas lgicas de los sitios donde se almacenan los datos del sistema incluyendo nombre, descripcin, alias, contenido y organizacin. Identifica los procesos donde se emplean los datos y los sitios donde se necesitan el acceso inmediato a las informacion

Es una BD relacional, el diccionario de datos proporciona informacion acerca de:

La estructura lgica y fsica de la BD. Las definiciones de todos los objetos de la BD: tablas, vistas, ndices, disparadores, procedimientos, funciones, etc. El espacio asignado y utilizado por los objetos. Los valores por defectos de las columnas de las tablas. Informacin acerca de las restricciones de integridad. Los privilegios y roles otorgados a los usuarios. Auditoria de informacin, como los accesos a los objetos.

Un diccionario de datos debe cumplir las siguientes caractersticas:


Debe soportar las descripciones de los modelos conceptual, lgico interno y externo de la BD. Debe estar integrado dentro del SGBD. Debe apoyar la transparencia eficiencia de informacion al SGDB. La conexin entre los modelos internos y externos debe ser realizada en tiempo de ejecucin. Debe comenzar con la reorganizacin de versiones de produccin de la BD. Adems debe reflejar los cambios en la descripcin de la BD. Cualquier cambio a la descripcin de programas ha de ser reflejado automticamente en la librera de descripcin de programas con la ayuda del diccionario de datos. Debe estar almacenado en un medio de almacenamiento con acceso directo para la fcil recuperacin de la informacin.

Niveles de transparencia
La transparencia se puede entender como la separacin de las semntica de alto nivel de un sistema de los aspectos de bajo nivel relacionados a la implementacin del mismo. Un nivel de transparencia adecuado permite ocultar los detalles de implementacin a las capas de alto nivel de un sistema y a otro usuarios.

Niveles de transparencia

Transparencia de Red.
La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia.

Transparencia de Localizacin.
Transparencia sobre la localizacin de datos. el comando que se usa es independiente de la ubicacin de los datos en la red y del lugar en donde la operacin se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer una copia de archivo. Cp se utiliza para copias locales y rcp se utiliza para copias remotas. En este caso no existe transparencia sobre la localizacin.

Transparencia de Fragmentacin.
La transparencia a nivel de fragmentacin de datos permite que cuando los objetos de la bases de datos estn fragmentados, el sistema tiene que manejar la conversin de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos. As tambin, ser necesario mezclar las respuestas a consultas fragmentadas para obtener una sola respuesta a una consulta global. El acceso a una base de datos distribuida debe hacerse en forma transparente.

Transparencia de Replica.
La transparencia sobre replicacin de datos se refiere a que si existen rplicas de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las rplicas en un sistema, el trabajo de ste es mnimo por lo que se puede obtener una eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia de las rplicas teniendo as datos diferentes.

Conclusin.
En resumen, la transparencia tiene como punto central la independencia de datos. La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos distribuida. Entre estos tres mdulos se deben resolver los aspectos sobre el procesamiento distribuido de consultas y sobre el manejo de nombres de objetos distribuidos.

Fragmentacin de datos
Consiste en decidir como dividimos la base de datos y en que partes. Razones por las que realizar la fragmentacin. La fragmentacin de datos nos permite obtener mejoras debido a: 1. Eficiencia. Los datos se almacenan donde van a ser utilizados y as no existe redundancia. 2. Paralelismo: Las transacciones pueden dividirse en subconsultas que operan con fragmentos. 3. Seguridad: Los datos no necesarios localmente no se almacenan y se evita su uso por los usuarios no autorizados.

Tipos de Fragmentacin
Fragmentacin Horizontal Consiste del particionamiento en tuplas de una relacin global en subconjuntos, donde cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operacin de seleccin sobre la relacin global.

Ejemplo:
Se ilustra una posible fragmentacin de la tabla Alumnos de dos fragmentos: uno para el nodo de la EUI y otro para el nodo de la EUIT.

Fragmentacin Horizontal

Fragmentacin Horizontal

La recuperacin de la relacin original se realizar a partir de la unin de cada uno de los fragmentos: T= T1 T2...Tn

En este caso: ALUMNOS=ALUMNOS_EUI ALUMNOS_EUIT

Fragmentacin Vertical La fragmentacin vertical es la subdivisin de atributos en grupos. Los fragmentos se obtienen proyectando la relacin global sobre cada grupo. La fragmentacin es correcta si cada atributo se mapea en al menos un atributo del fragmento.

Ejemplo:

Supongamos que en el rectorado existen dos departamentos ubicados en distinto lugares y con necesidades distintas de informacin.

Fragmentacin Vertical

Departamento Infraestructura

Datos Rectorado

Departamento ordenacin acadmica

Fragmentacin Hibrida En la que respecto a la fragmentacin hbrida, esta consiste en aplicar la fragmentacin vertical seguida de la fragmentacin horizontal o viceversa.

Vertical

Horizontal

Hibrida

Fragmentacin Hibrida Ejemplo: Podemos partir de la relacin resultante de la fragmentacin horizontal en la tabla de alumnos. Supongamos que en la EUI existen dos nodos dedicados a distintas funciones. Uno de ellos sera el de secretara que maneja la informacin referente a los alumnos y sus becas. Otro podra ser el de Jefatura de Estudios que utiliza la informacin referente a las notas de ingreso de los distintos alumnos. Tendramos el siguiente esquema:

Fragmentacin Hibrida

Secretaria

Datos EUI Resultante de fragmentacin horizontal previa

Jefatura estudios

Consideraciones de Diseo de BDD


Existe varios factores relacionados a la construccin de bases de datos distribuidas que no se presentan en base de datos centralizadas. Entre los mas importante se encuentra los siguiente: Diseo de la base de datos distribuidas. Procesamiento de consultas. Control de concurrencia. Confiabilidad.

También podría gustarte