Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnología de Redes de
Bases de Datos Computadoras
Integración Distribución
Sistemas de
Bases de Datos
Distribuidas
Integración
Integración Centralización
Computación Distribuida
Términos sinónimos:
Función distribuida.
Procesamiento distribuido de datos.
Procesamiento satelital.
Procesamiento dorsal.
Computadoras de propósito especial/dedicado.
Sistemas de tiempo compartido.
Sistema modular funcional.
¿Qué está Distribuido? ...
Lógica de procesamiento.
Funciones.
Datos.
Control.
¿Qué es un Sistema de Base de Datos
Distribuida?
BD
Sitio 3
RED
Sitio 1
Sitio 2
SMBD Distribuidas
BD
Sitio 3
RED
BD
Sitio 1
BD
Sitio 2
Implícitamente se Supone que
Los datos están almacenados en diferentes sitios (cada uno de los sitios lógicamente consiste
de un procesador).
Los procesadores en diferentes sitios se encuentran inter- conectados vía una red de
comunicaciones (no multipro-cesadores).
Sistemas de bases de datos en paralelo.
La base de datos distribuida es una base de datos, no una colección de archivos (datos
lógicamente relacionados que son presentados al usuario con un patrón de acceso).
Modelo de datos relacional.
Un SABDD es un SABD completo.
No es un sistema de archivos distribuidos, ni un sistema TP.
Arquitectura de Memoria Compartida
P1 • • • Pn M
BD
P1 Pn
• • •
BD
M1 Mn
P1 Pn
BD1 • • • BDn
M1 Mn
Falta de experiencia.
Complejidad.
Costo.
Distribución del control.
Dificultad de cambio.
Problemáticas en los SABDDs
Diseño de bases de datos distribuidas.
¿Cómo distribuir la base de datos?
Distribución de la base de datos replicada y no-replicada.
Problema relacionado con la administración del diccionario.
Procesamiento de consultas.
Problema de optimización.
Min{costo = transmisión de datos + procesamiento local}.
La formulación general es un problema NP completo.
Conversión de transacciones de usuario a instrucciones de manipulación de datos.
Problemática en el Procesamiento de Consultas
El proceso de optimización de consultas necesita ser
distribuido; consta de dos fases:
Optimización Global:
- Medios de Transmisión.
- Distribución de Subconsultas.
Optimización Local:
- Accesos a Disco.
- Manipulación de Memoria.
- Uso de Indices.
Opciones para Almacenar el Diccionario
1. Centralizado 3. Particionado
DICCIONARIO
DICCIONARIO
d1 d2 d3
d1 d2 d3
Sitio C
Sitio A Sitio B
Sitio C
Sitio A Sitio B
Red Red
Red Red
d1 d2 d3 d1 d2 d1 d2 d3 d3
d1 d2 d3 d1 d2 d3
Sitio C Sitio C
Sitio A Sitio B Sitio A Sitio B
Administración
de Directorio
Procesamiento Diseño de
Fiabilidad
de Consultas Distribución
Control de
Concurrencia
Administración
de Interbloqueo
Problemáticas Relacionadas
Soporte de sistema operativo.
Sistema operativo con soporte adecuado para operar bases de datos.
Dicotomía entre requerimientos de procesamiento de propósito general y requerimientos de
procesamiento de bases de datos.
Sistemas abiertos e interoperabilidad.
Sistemas multibases de datos.
Escenarios con mayor probabilidad.
Problemáticas de paralelismo.
Promesas de los SABDDs
Mejora en la eficiencia.
Tener los datos lo más cercanos a cada uno de los sitios en donde las aplicaciones
los soliciten.
Repetición total.
¿Qué pasa con las actualizaciones?
Las actualizaciones a datos repetidos requieren la implementación de control de
concurrencia y protocolos de compromiso.