FUNDAMENTOS DE BASE DE DATOS DISTRIBUIDAS 6o Semestre

FUNDAMENTOS DE SISTEMAS
BASES DE DATOS DISTRIBUIDAS
M.C.C. Blanca E. Pichardo Orozco

Motivaciones
Tecnología de Redes de
Bases de Datos Computadoras
Integración Distribución
Sistemas de
Bases de Datos
Distribuidas
Integración
Integración  Centralización
Computación Distribuida
 Un concepto en busca de un nombre y una definición.

 Un conjunto de elementos de procesamiento autónomos (no necesariamente homogéneos) que
se encuentran interconectados mediante una red de comunicaciones y que cooperan en la
ejecución de sus tareas asignadas.
Computación Distribuida
 Términos sinónimos:
 Función distribuida.
 Procesamiento distribuido de datos.
 Procesamiento satelital.
 Procesamiento dorsal.
 Computadoras de propósito especial/dedicado.
 Sistemas de tiempo compartido.
 Sistema modular funcional.
¿Qué está Distribuido? ...
 Lógica de procesamiento.
 Funciones.
 Datos.
 Control.
¿Qué es un Sistema de Base de Datos
Distribuida?
Una Base de Datos Distribuida (BDD) es aquélla en la que

sus datos se encuentran repartidos en varias computadoras
que están interconectadas por una red de comunicaciones.
Un Sistema Adminstrador de Bases de Datos Distribuidas

(SABDD) es el software que administra la BDD y propor- ciona un mecanismo
de acceso que hace transparente esta distribución a los usuarios.
Sistema de Base de Datos Distribuida (SBDD) = BDD + SABDD

¿Qué no es un SBDD?
 Un sistema de cómputo de tiempo compartido.

 Un sistema multiprocesador fuertemente o débilmente acoplado.
 Un sistema de base de datos, el cual reside en un solo nodo de la red (esto es una base de
datos centralizada).
SMBD Centralizadas
BD
Sitio 3
RED
Sitio 1
Sitio 2
SMBD Distribuidas
BD
Sitio 3
RED
BD
Sitio 1
BD
Sitio 2
Implícitamente se Supone que
 Los datos están almacenados en diferentes sitios (cada uno de los sitios lógicamente consiste
de un procesador).
 Los procesadores en diferentes sitios se encuentran interconectados vía una red de
comunicaciones (no multipro-cesadores).
 Sistemas de bases de datos en paralelo.
 La base de datos distribuida es una base de datos, no una colección de archivos (datos
lógicamente relacionados que son presentados al usuario con un patrón de acceso).
 Modelo de datos relacional.
 Un SABDD es un SABD completo.
 No es un sistema de archivos distribuidos, ni un sistema TP.
Arquitectura de Memoria Compartida
P1 • • • Pn M
BD
Ejemplos: Multiprocesadores simétricos (Sequent,

Encore) y algunos "mainframes"
(IBM 3090, DPS8 de Bull).
Arquitectura de Disco Compartido
P1 Pn
• • •
BD
M1 Mn
Ejemplos: VAXcluster de DEC, IMS/VS de IBM

y Data Sharing.
Arquitectura con Nada Compartido
P1 Pn
BD1 • • • BDn
M1 Mn
Ejemplos: DBC de Teradata, Tandem, Paragon

de Intel, 3600 y 3700 de NCR.
Aplicaciones
 Manufactura (especialmente en manufactura multiplanta).

 Comando y control militar.
 SIGs corporativos.
 Aerolíneas.
 Cadenas hoteleras.
 Cualquier organización que tenga una estructura organizacional
descentra-lizada.
Ventajas de los SBDDs
 Razones económicas y organizacionales.

 Fiabilidad y disponibilidad.
 Distribución del control y utilización compartida de datos.
 Reducción de tráfico en la comunicación de datos.
 Agilización del procesamiento de consultas.
 Interconexión de bases de datos existentes.
 Crecimiento incremental.
Objetivos1 de las BDDs
 Autonomía local.
 Independencia de un sitio central.
 Operación continua.
 Transparencia de localización.
 Transparencia de fragmentación.
 Transparencia de repetición.
 Procesamiento distribuido de consultas.
 Procesamiento de transacciones distribuidas.
 Transparencia de "hardware".
 Transparencia de sistema operativo.
 Transparencia de red.
1 C.J. Date
 Transparencia de SMBD.
Desventajas de los SBDD
 Falta de experiencia.
 Complejidad.
 Costo.
 Distribución del control.
 Dificultad de cambio.
Problemáticas en los SABDDs
 Diseño de bases de datos distribuidas.
 ¿Cómo distribuir la base de datos?
 Distribución de la base de datos replicada y no-replicada.
 Problema relacionado con la administración del diccionario.
 Procesamiento de consultas.
 Problema de optimización.
 Min{costo = transmisión de datos + procesamiento local}.
 La formulación general es un problema NP completo.
 Conversión de transacciones de usuario a instrucciones de manipulación de datos.
Problemática en el Procesamiento de Consultas
El proceso de optimización de consultas necesita ser
distribuido; consta de dos fases:
Optimización Global:
- Medios de Transmisión.
- Distribución de Subconsultas.
Optimización Local:
- Accesos a Disco.
- Manipulación de Memoria.
- Uso de Indices.
Opciones para Almacenar el Diccionario
1. Centralizado 3. Particionado
DICCIONARIO
DICCIONARIO
d1 d2 d3
d1 d2 d3
Sitio C
Sitio A Sitio B
Sitio C
Sitio A Sitio B
Red Red
Red Red
2. Completamente Replicado 4. Combinación de 1 y 3

DICCIONARIO DICCIONARIO DICCIONARIO DICCIONARIO
d1 d2 d3 d1 d2 d1 d2 d3 d3
d1 d2 d3 d1 d2 d3
Sitio C Sitio C
Sitio A Sitio B Sitio A Sitio B
Red Red Red Red

Problemáticas en los SABDDs
 Control de concurrencia.
 Sincronización de accesos concurentes.
 Mantenimiento de congruencia y aislamiento de los efectos de las transacciones.
 Manejo de interbloqueo .
 Fiabilidad.
 ¿Cómo hacer el sistema resistente a fallas?
 Atomicidad y durabilidad.
Relación entre Problemas
Administración
de Directorio
Procesamiento Diseño de
Fiabilidad
de Consultas Distribución
Control de
Concurrencia
Administración
de Interbloqueo
Problemáticas Relacionadas
 Soporte de sistema operativo.
 Sistema operativo con soporte adecuado para operar bases de datos.
 Dicotomía entre requerimientos de procesamiento de propósito general y requerimientos de
procesamiento de bases de datos.
 Sistemas abiertos e interoperabilidad.
 Sistemas multibases de datos.
 Escenarios con mayor probabilidad.
 Problemáticas de paralelismo.
Promesas de los SABDDs
 Manipulación transparente de datos distribuidos, repetidos y fragmentados.
 Mejora en confiabilidad y disponibilidad por medio de transacciones distribuidas.
 Mejora en la eficiencia.
 Expansión de sistemas fácil y económica.

Soporte de Transparencia
 Aún no hay de repetición.

 Tampoco hay de fragmentación.
 Pudiera venir la fragmentación horizontal.
 Transparencia de distribución aún limitada.
 Especificar camino.
 Manejo de alias.
 Login remoto a un SMBD.
 La mayoría son múltiples clientes con un solo servidor.
Transacciones Distribuidas en Sistemas Comerciales
 Algunos no las proporcionan del todo.

 Oracle 6.x tiene que abrir una sola base de datos a la vez, Sybase ofrece las primitivas, las
aplicaciones tienen que implementar las transacciones distribuidas por sí mismas.
 Otros lo hacen.
 Ingres, NonStop SQL, y Oracle ver.7.
 Soporte de repetición.
 No existe.
 Utilizan la regla ROWA: Read One Write All.
En Busca de Mejora en la Eficiencia
 Proximidad de datos a sus sitios de uso.

 Requiere soporte de fragmentación y repetición.
 Paralelismo en la ejecución.
 Paralelismo inter-consulta.
 Paralelismo intra-consulta.
Requerimientos para el Paralelismo
 Tener los datos lo más cercanos a cada uno de los sitios en donde las aplicaciones
los soliciten.
 Repetición total.
 ¿Qué pasa con las actualizaciones?
 Las actualizaciones a datos repetidos requieren la implementación de control de
concurrencia y protocolos de compromiso.

FUNDAMENTOS DE BASE DE DATOS DISTRIBUIDAS 6o Semestre

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

FUNDAMENTOS DE BASE DE DATOS DISTRIBUIDAS 6o Semestre

Cargado por

Copyright:

Formatos disponibles

FUNDAMENTOS DE SISTEMAS

BASES DE DATOS DISTRIBUIDAS

M.C.C. Blanca E. Pichardo Orozco

 Un concepto en busca de un nombre y una definición.

Una Base de Datos Distribuida (BDD) es aquélla en la que

Un Sistema Adminstrador de Bases de Datos Distribuidas

Sistema de Base de Datos Distribuida (SBDD) = BDD + SABDD

 Un sistema de cómputo de tiempo compartido.

Ejemplos: Multiprocesadores simétricos (Sequent,

Ejemplos: VAXcluster de DEC, IMS/VS de IBM

Ejemplos: DBC de Teradata, Tandem, Paragon

 Manufactura (especialmente en manufactura multiplanta).

 Razones económicas y organizacionales.

2. Completamente Replicado 4. Combinación de 1 y 3

Red Red Red Red

 Manipulación transparente de datos distribuidos, repetidos y fragmentados.

 Mejora en confiabilidad y disponibilidad por medio de transacciones distribuidas.

 Expansión de sistemas fácil y económica.

 Aún no hay de repetición.

 Algunos no las proporcionan del todo.

 Proximidad de datos a sus sitios de uso.

También podría gustarte