Está en la página 1de 3

BASES DE DATOS DISTRIBUIDAS

➔ ¿Qué es?
Una base de datos distribuida es una base de datos almacenada en varias
computadoras que se comunican entre ellas a través de diferentes medios de
comunicación de forma que funcionan como una sola base de datos.
Se utiliza el término “sitio” para referirse a cada computadora física que contiene
una parte de una base de datos distribuida.A la hora de que un usuario realice una
petición, se puede acceder hasta a los datos de un sitio como a los de varios.

La principal diferencia entre una base de datos centralizada y una distribuida es la


localización de los datos.

Un "sitio" es el conjunto de software y hardware donde se encuentran todas las


partes necesarias para que funcionen las computadoras y las aplicaciones
informáticas, ya sea una sola unidad o un grupo de ellas trabajando juntas en una
red interna. Es el conjunto de software y hardware.

El enlace es el canal de comunicación entre dos sitios de la red y tiene la capacidad


de transferencia de datos.

Un agente es un proceso que ejecuta una transacción en un sitio concreto, y la


diferencia entre una transacción local y una transacción global radica en si la
transacción se realiza en un único sitio(un único agente) o requiere la colaboración
de múltiples sitios para su ejecución(varios agentes).

El sistema de gestión de base de datos distribuida (SGBDD) es el software que


permite el almacenamiento de los datos de forma que cumplan las características de
una base de datos distribuida.

El SGBDD puede ser homogéneo o heterogéneo(si se trata de sistemas de


gestión de bases de datos diferentes).

Las bases de datos distribuidas pueden ser autonómicas(se diseña ya como una
base de datos distribuida) o federadas(unión de base de datos centralizadas,se
gestionan de forma diferente).

Las diferentes topologías de una base de


datos distribuida:
★ De bus
★ En estrella
★ En anillo
★ Jerárquica
★ Malla

Noelia Ruiz Morón Grado en Ingeniería informática


Algunos factores a tener en cuenta a la hora de elegir la topología de la base de
datos distribuida son:
★ Coste de instalación.
★ Coste de comunicación.
★ Fiabilidad.
★ Disponibilidad.
★ Frecuencia y volumen de datos que se debe acceder.
➔ Diseño de Bases de Datos Distribuida
El diseño de bases de datos distribuidas implica la fragmentación de los datos, es
decir, dividir la base de datos en partes más pequeñas y distribuir esas partes en
diferentes sitios o servidores.
La fragmentación de los datos puede ser horizontal,vertical o mixta.
★ Fragmentación horizontal
Los datos de la base de datos se dividen en filas o tuplas.Cada fragmento contiene
registros completos pero diferentes.
★ Fragmentación vertical
Los datos de la base de datos se dividen en columnas.Por ejemplo, un sitio puede
necesitar información de contacto de un cliente, mientras que otro sitio necesita
información de facturación del mismo cliente.
★ Fragmentación mixta
Combinación de fragmentación horizontal y vertical.Los datos se dividen tanto en
filas como en columnas.

➔ El administrador de transacciones(optimizador)
Tiene como tarea fundamental la transformación de una consulta de alto nivel en
otra equivalente que se ejecute con una estrategia más eficiente.
En sistemas distribuidos, el administrador de transacciones debe considerar otros
aspectos:
★ Intercambio de Datos(los datos pueden estar en diferentes ubicaciones,así
que el optimizador debe evaluar cómo se intercambian los datos para
ejecutar la consulta de forma eficiente)
★ Orden de Operaciones y Ubicación de Procesamiento(selección del orden
óptimo de las operaciones relacionales)

➔ Recuperación de fallos

★ Si hay réplicas en el sitio que experimenta un fallo, hay que actualizar las
réplicas antes de que ninguna consulta pueda acceder a los datos sin
actualizar(copia coherente de los datos).
★ Si hay transacciones ejecutándose en un sitio y este falla,estas
transacciones tienen que abortarse tan pronto como se pueda.
★ Si falla el servidor central,se debe elegir un nuevo servidor que asuma
responsabilidades y procesamiento que tenía el que ha fallado(continuidad
de las operaciones).

Noelia Ruiz Morón Grado en Ingeniería informática


➔ Almacenamiento del Catálogo

El catálogo es un elemento que contiene la información de la base de datos y los


datos necesarios para el control distribuido.Se puede almacenar de las siguientes
formas:
★ Centralizada:una única copia del catálogo en el servidor central.
★ Réplicas completas:una copia del catálogo en cada sitio.
★ Dividido:cada sitio mantiene su propio catálogo local.
★ Combinación de centralizado y dividido:cada sitio mantiene su propio
catálogo local y además un sitio central único mantiene una copia global
centralizada.

➔ Control de concurrencia
La atomicidad de una transacción de los SGBDD es mucho más complicada,ya
que pueden haber varios sitios participando en la ejecución de esa transacción. El
control de la concurrencia está basado en el bloqueo de dos fases.

Noelia Ruiz Morón Grado en Ingeniería informática

También podría gustarte