Está en la página 1de 28

FUNDAMENTOS DE SISTEMAS

BASES DE DATOS DISTRIBUIDAS

M.C.C. Blanca E. Pichardo Orozco


Motivaciones

Tecnología de Redes de
Bases de Datos Computadoras

Integración Distribución

Sistemas de
Bases de Datos
Distribuidas

Integración

Integración  Centralización
Computación Distribuida

 Un concepto en busca de un nombre y una definición.


 Un conjunto de elementos de procesamiento autónomos (no necesariamente homogéneos) que
se encuentran interconectados mediante una red de comunicaciones y que cooperan en la
ejecución de sus tareas asignadas.
Computación Distribuida

 Términos sinónimos:
 Función distribuida.
 Procesamiento distribuido de datos.
 Procesamiento satelital.
 Procesamiento dorsal.
 Computadoras de propósito especial/dedicado.
 Sistemas de tiempo compartido.
 Sistema modular funcional.
¿Qué está Distribuido? ...

 Lógica de procesamiento.
 Funciones.
 Datos.
 Control.
¿Qué es un Sistema de Base de Datos
Distribuida?

Una Base de Datos Distribuida (BDD) es aquélla en la que


sus datos se encuentran repartidos en varias computadoras
que están interconectadas por una red de comunicaciones.

Un Sistema Adminstrador de Bases de Datos Distribuidas


(SABDD) es el software que administra la BDD y propor- ciona un mecanismo
de acceso que hace transparente esta distribución a los usuarios.

Sistema de Base de Datos Distribuida (SBDD) = BDD + SABDD


¿Qué no es un SBDD?

 Un sistema de cómputo de tiempo compartido.


 Un sistema multiprocesador fuertemente o débilmente acoplado.
 Un sistema de base de datos, el cual reside en un solo nodo de la red (esto es una base de
datos centralizada).
SMBD Centralizadas

BD

Sitio 3
RED

Sitio 1

Sitio 2
SMBD Distribuidas

BD

Sitio 3
RED
BD
Sitio 1

BD
Sitio 2
Implícitamente se Supone que
 Los datos están almacenados en diferentes sitios (cada uno de los sitios lógicamente consiste
de un procesador).
 Los procesadores en diferentes sitios se encuentran inter- conectados vía una red de
comunicaciones (no multipro-cesadores).
 Sistemas de bases de datos en paralelo.
 La base de datos distribuida es una base de datos, no una colección de archivos (datos
lógicamente relacionados que son presentados al usuario con un patrón de acceso).
 Modelo de datos relacional.
 Un SABDD es un SABD completo.
 No es un sistema de archivos distribuidos, ni un sistema TP.
Arquitectura de Memoria Compartida

P1 • • • Pn M

BD

Ejemplos: Multiprocesadores simétricos (Sequent,


Encore) y algunos "mainframes"
(IBM 3090, DPS8 de Bull).
Arquitectura de Disco Compartido

P1 Pn
• • •
BD
M1 Mn

Ejemplos: VAXcluster de DEC, IMS/VS de IBM


y Data Sharing.
Arquitectura con Nada Compartido

P1 Pn
BD1 • • • BDn
M1 Mn

Ejemplos: DBC de Teradata, Tandem, Paragon


de Intel, 3600 y 3700 de NCR.
Aplicaciones

 Manufactura (especialmente en manufactura multiplanta).


 Comando y control militar.
 SIGs corporativos.
 Aerolíneas.
 Cadenas hoteleras.
 Cualquier organización que tenga una estructura organizacional
descentra-lizada.
Ventajas de los SBDDs

 Razones económicas y organizacionales.


 Fiabilidad y disponibilidad.
 Distribución del control y utilización compartida de datos.
 Reducción de tráfico en la comunicación de datos.
 Agilización del procesamiento de consultas.
 Interconexión de bases de datos existentes.
 Crecimiento incremental.
Objetivos1 de las BDDs
 Autonomía local.
 Independencia de un sitio central.
 Operación continua.
 Transparencia de localización.
 Transparencia de fragmentación.
 Transparencia de repetición.
 Procesamiento distribuido de consultas.
 Procesamiento de transacciones distribuidas.
 Transparencia de "hardware".
 Transparencia de sistema operativo.
 Transparencia de red.
1 C.J. Date
 Transparencia de SMBD.
Desventajas de los SBDD

 Falta de experiencia.
 Complejidad.
 Costo.
 Distribución del control.
 Dificultad de cambio.
Problemáticas en los SABDDs
 Diseño de bases de datos distribuidas.
 ¿Cómo distribuir la base de datos?
 Distribución de la base de datos replicada y no-replicada.
 Problema relacionado con la administración del diccionario.
 Procesamiento de consultas.
 Problema de optimización.
 Min{costo = transmisión de datos + procesamiento local}.
 La formulación general es un problema NP completo.
 Conversión de transacciones de usuario a instrucciones de manipulación de datos.
Problemática en el Procesamiento de Consultas
El proceso de optimización de consultas necesita ser
distribuido; consta de dos fases:

Optimización Global:
- Medios de Transmisión.
- Distribución de Subconsultas.

Optimización Local:
- Accesos a Disco.
- Manipulación de Memoria.
- Uso de Indices.
Opciones para Almacenar el Diccionario
1. Centralizado 3. Particionado
DICCIONARIO
DICCIONARIO
d1 d2 d3
d1 d2 d3

Sitio C
Sitio A Sitio B
Sitio C
Sitio A Sitio B
Red Red
Red Red

2. Completamente Replicado 4. Combinación de 1 y 3


DICCIONARIO DICCIONARIO DICCIONARIO DICCIONARIO

d1 d2 d3 d1 d2 d1 d2 d3 d3
d1 d2 d3 d1 d2 d3

Sitio C Sitio C
Sitio A Sitio B Sitio A Sitio B

Red Red Red Red


Problemáticas en los SABDDs
 Control de concurrencia.
 Sincronización de accesos concurentes.
 Mantenimiento de congruencia y aislamiento de los efectos de las transacciones.
 Manejo de interbloqueo .
 Fiabilidad.
 ¿Cómo hacer el sistema resistente a fallas?
 Atomicidad y durabilidad.
Relación entre Problemas

Administración
de Directorio

Procesamiento Diseño de
Fiabilidad
de Consultas Distribución

Control de
Concurrencia

Administración
de Interbloqueo
Problemáticas Relacionadas
 Soporte de sistema operativo.
 Sistema operativo con soporte adecuado para operar bases de datos.
 Dicotomía entre requerimientos de procesamiento de propósito general y requerimientos de
procesamiento de bases de datos.
 Sistemas abiertos e interoperabilidad.
 Sistemas multibases de datos.
 Escenarios con mayor probabilidad.
 Problemáticas de paralelismo.
Promesas de los SABDDs

 Manipulación transparente de datos distribuidos, repetidos y fragmentados.

 Mejora en confiabilidad y disponibilidad por medio de transacciones distribuidas.

 Mejora en la eficiencia.

 Expansión de sistemas fácil y económica.


Soporte de Transparencia

 Aún no hay de repetición.


 Tampoco hay de fragmentación.
 Pudiera venir la fragmentación horizontal.
 Transparencia de distribución aún limitada.
 Especificar camino.
 Manejo de alias.
 Login remoto a un SMBD.
 La mayoría son múltiples clientes con un solo servidor.
Transacciones Distribuidas en Sistemas Comerciales

 Algunos no las proporcionan del todo.


 Oracle 6.x tiene que abrir una sola base de datos a la vez, Sybase ofrece las primitivas, las
aplicaciones tienen que implementar las transacciones distribuidas por sí mismas.
 Otros lo hacen.
 Ingres, NonStop SQL, y Oracle ver.7.
 Soporte de repetición.
 No existe.
 Utilizan la regla ROWA: Read One Write All.
En Busca de Mejora en la Eficiencia

 Proximidad de datos a sus sitios de uso.


 Requiere soporte de fragmentación y repetición.
 Paralelismo en la ejecución.
 Paralelismo inter-consulta.
 Paralelismo intra-consulta.
Requerimientos para el Paralelismo

 Tener los datos lo más cercanos a cada uno de los sitios en donde las aplicaciones
los soliciten.
 Repetición total.
 ¿Qué pasa con las actualizaciones?
 Las actualizaciones a datos repetidos requieren la implementación de control de
concurrencia y protocolos de compromiso.

También podría gustarte