Unidad 1-Bases de Datos Distribuidas

Bases de Datos
1. INTRODUCCIÓN
La forma de tratar los datos mediante un solo ordenador ha ido dejando paso a
la idea o posibilidad de que los datos se almacenen en varios equipos situados en
lugares diferentes.
Podemos decir que un sistema de bases de datos distribuidas será una base
de datos segmentada en varias localizaciones que están interconectadas a través de
una red. Cada punto o equipo de la base de datos se llama “NODO”.
2. ESTRUCTURA DE LAS BASES DE DATOS DISTRIBUIDAS
El hecho de que en una base de datos distribuida la información se

encuentre dispersa por varios nodos permite que se puedan realizar dos tipos
de transacciones:
TRANSACCIONES LOCALES: procesan información situada en el mismo nodo,

son fragmentos de programa que acceden a la parte local de una base
de datos.
TRANSACCIONES GLOBALES: procesan información situada en nodos

diferentes, son fragmentos de programa que acceden a partes de la
base de datos que se encuentran en otros nodos. En este segundo
caso requieren ordenadores interconectados entre si.
Según la situación geográfica la conexión entre nodos se realiza

mediante:
- REDES DE LARGA DISTANCIA (WAN) (REDES DE AREA EXTENSA): Los nodos

ocupan localidades diferentes distribuidas por el mismo país o por
países diferentes.
- REDES DE AREA LOCAL (LAN): Los nodos ocupan el mismo edificio o

edificios próximos situados en la misma localidad. Ejemplo: la de
clase.
2.1 INTERCONEXION DE NODOS
La unión entre los diferentes nodos puede hacerse de las siguientes maneras:
- REDES EN BUS: están conectados a través del bus
- REDES EN MALLA: cada nodo esta conectado con todos.
- REDES EN ÁRBOL: no se suelan usar porque su estructura es muy

complicada o compleja.
1
Bases de Datos
- REDES EN ANILLO
- REDES EN ESTRELLA: hay un nodo principal que gestiona toda la red, por
lo que si este falla nos quedamos sin red.
Las diferencias entre estos tipos de redes se deben a los siguientes

factores:
- Coste de instalación: que es la unión física entre los nodos,
dependerá del número de interconexiones, ya que cuantas más
haya será más caro.
- Coste de las comunicaciones: que será el coste en tiempo y en
dinero para acceder a la información en un nodo, dependerá de la
conexión física que tengamos entre los nodos.
- Confiabilidad: frecuencia con la que fallan las líneas.
- Disponibilidad: posibilidad de acceder a los datos a pesar de los
fallos que se puedan producir en los nodos o los fallos que se
puedan producir en las líneas de comunicación.
3. ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS
Existen varias formas de distribuir la información a través de los nodos de la

red, lo cual permite clasificar las bases de datos en los siguientes tipos:
a) BASE DE DATOS MULTIPLICADA: en esta base de datos todos los archivos están
duplicados en cada nodo con el fin de reducir los costes de comunicación y
el tiempo de respuesta. Presenta el inconveniente de la cantidad de
espacio necesario para su almacenamiento, mucha redundancia y
problemas de actualización.
b) BASE DE DATOS PARTICIONADA: es la forma más simple de distribuir los datos

en una red. Se reparten los archivos entre los distintos nodos evitándose la
duplicidad de datos. Presenta la ventaja de tener que actualizar solo un
archivo cada vez que se produce una transacción, pero cuando se desea
hacer una consulta que implica la necesidad de acceder a varios nodos
diferentes supone un aumento del coste de tiempo, un fallo en cualquier
nodo puede dejar a toda la red sin servicio.
c) BASE DE DATOS CON NODO CENTRAL: todos los archivos se ubican en un mismo
nodo, con este sistema se reducen los problemas de actualizaciones, pero
debe optimizarse el coste de las comunicaciones haciendo una elección
apropiada del nodo central. Si este nodo sufre un fallo toda la red puede
quedar inutilizada.
d) BASE DE DATOS CON ARCHIVOS DUPLICADOS EN NODOS SELECCIONADOS: es la más

flexible de todas las construcciones o tipos de bases de datos distribuidas.
Los archivos que se utilicen solo en un nodo se almacenan en él, y los
archivos que puedan ser requeridos por varios nodos se ubican en todos
ellos. Este sistema presenta problemas de actualización al estar duplicados
los archivos. Otro inconveniente es la búsqueda de datos que se
encuentran en nodos diferentes.
2
Bases de Datos
4. VENTAJAS Y DESVENTAJAS DE LAS BASES DE DATOS

DISTRIBUIDAS
Las VENTAJAS son:
- Posibilidad de acceder a la información de otros nodos

- Pueden agilizarse algunas consultas si parte de ellas se ejecutan en
otros nodos de forma paralela.
- Mayor eficiencia en el control de los datos que se usan con más
frecuencia en cada uno de los nodos.
- Confiabilidad. Cuando un nodo sufre un fallo no tiene porque dejar
de funcionar la base de datos (dependiendo del tipo de base de
datos distribuida que utilicemos).
Las DESVENTAJAS son:
- Coste del software.

- Coste de las comunicaciones, hay que conectar todos los nodos de
la red.
- Actualización de los datos duplicados.
- Mayor posibilidad de errores por el hecho de que varios nodos
puedan acceder al mismo dato.
- Complejidad del sistema.
- Mayor tiempo de procesamiento cuando se trata de transacciones
globales.
5. INTEGRIDAD Y SEGURIDAD
5.1 INTEGRIDAD
TRANSACCIÓN se define una transacción como una secuencia de

operaciones que se producen en un nodo de manera que cuando termina quedan
confirmadas todas las actualizaciones que ha realizado y preserva la integridad de la
base de datos. Si la transacción fuera abortada se debe anular todas las
actualizaciones que hubiera hecho.
En las bases de datos distribuidas la información esta compartida por varios

usuarios situados en distintos nodos o terminales, por ello puede darse el caso de que
dos o más usuarios distintos realicen transacciones sobre los mismos datos al mismo
tiempo. Esto produce dos problemas que son la actualización incorrecta y el bloqueo
mutuo.
3
Bases de Datos
Actualización incorrecta:
EJEMPLO: cajas de un supermercado
INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2

Adquiere 5 unidades del
T1 producto X. Para actualizar se
lee el stock y quedan 100.
Adquiere 10 unidades del
Se hacen las operaciones de
T2 producto X. Para actualizar se
cálculo.
lee el stock y quedan 100.
Se anotan en el stock que
T3 Se hacen operaciones de cálculo
quedan 95 (100-5) unidades
Se anota el en stock que quedan
T4 90 unidades (100-10), cuando
realmente quedan 85.
La solución a la actualización incorrecta es lo que se llama “CIERRE”.

El cierre consiste en poner un semáforo que estará cerrado cuando el registro o
dato correspondiente se esté actualizando, y el semáforo estará abierto en otro caso.
CIERRE CON SEMÁFOROS
EJEMPLO: Cajas de un supermercado
INSTANTES DE CLIENTE CAJA 1 CLIENTE CAJA 2

TIEMPO
El cliente adquiere 5 unidades del
producto X. Para actualizar se cierra
T1 el semáforo del registro (del producto
X, donde esta el stock del producto) y
se lee el stock y quedan 100.
El cliente adquiere 10 unidades del
producto X. Para actualizar el
T2 Se hacen las operaciones de cálculo. semáforo del producto X esta cerrado,
por lo que se pasa a la cola de
espera.
Se anotan en el stock que quedan 95

T3 unidades (100-5) y se abre el ESPERA
semáforo.
El proceso sale de la cola. Se cierra el

T4 semáforo del registro del producto X.
Se lee el stock y quedan 95 unidades.
T5 Se hacen las operaciones de cálculo.
Se anotan que quedan 85 unidades y

T6 se abre el semáforo del registro del
producto X.
4
Bases de Datos
El semáforo puede ser para un dato, para un fichero entero, para un archivo, o
incluso a la base de datos.
BLOQUEO MUTUO es consecuencia del uso de semáforos y NO tiene solución.
EJEMPLO: cajas de un supermercado (pero no es el mismo ejemplo) en este

caso el semáforo se pone a todo el archivo.
INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2

El proceso accede al archivo El proceso accede al archivo
T1 ARTICULOS cerrando su CLIENTES cerrando su
semáforo. semáforo.
Se necesita acceder al archivo
ARTICULOS pero su semáforo
Se hacen las operaciones de
T2 esta cerrado, por tanto este
cálculo.
proceso2 pasa a la cola de
espera.
Se necesita acceder al fichero
CLIENTES, pero su semáforo
T3 esta cerrado, por tanto este
proceso1 pasa la cola de
espera.
La concurrencia o accesos concurrentes son los que provocan estos

dos tipos de problemas.
5.2 SEGURIDAD
En cuanto a seguridad de la base de datos vamos a tener dos niveles de

identificación:
- Un nivel para el acceso a los datos locales.
- Otro para transacciones globales.
6. ESTRUCTURAS CLIENTE/SERVIDOR
En una estructura cliente servidor el motor de la base de datos (aplicación) se

encuentra en un servidor central junto con el almacén de datos. El motor o servidor
puede dar servicio a varias aplicaciones cliente simultáneamente manipulando el
almacén de datos y devolviendo la información solicitada a cada aplicación local o
aplicación cliente.
Hoy en día la mayoría de los servidores de información son servidores de

bases de datos. El cliente no sabe gran cosa acerca de la manipulación y ubicación de
la información, así un cliente que quiere realizar una consulta o actualización de datos,
simplemente envía la petición al servidor, éste la tramita y devuelve los resultados.
5
Bases de Datos
La potencia de la estructura o plataforma cliente/servidor radica en la

concepción de la división de funciones. El cliente o usuario no se preocupa de nada,
salvo de hacer las peticiones. El servidor es el que gestiona el acceso a los datos,
realizando a la vez funciones de control y seguridad.
Características de un servidor de bases de datos moderno
Un servidor de bases de datos moderno deberá cumplir los siguientes

requisitos:
- Soportar algún protocolo TCP/IP.

- Permitir también la conexión a un elevado número de clientes.
- Permitir la manipulación de datos a través del lenguaje SQL.
- Permitir deshacer transacciones.
- Ofrecer la posibilidad de compartir datos que pertenezcan
físicamente a distintas bases de datos.
CLIENTE/SERVIDOR REMOTA
• Almacén de datos • Almacén de datos

• Motor de la BD
CLIENTES • Interfaz de usuario • Motor de la BD

• Interfaz de usuarios

Unidad 1-Bases de Datos Distribuidas

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 1-Bases de Datos Distribuidas

Cargado por

Copyright:

Formatos disponibles

Bases de Datos

2. ESTRUCTURA DE LAS BASES DE DATOS DISTRIBUIDAS

El hecho de que en una base de datos distribuida la información se

TRANSACCIONES LOCALES: procesan información situada en el mismo nodo,

TRANSACCIONES GLOBALES: procesan información situada en nodos

Según la situación geográfica la conexión entre nodos se realiza

- REDES DE LARGA DISTANCIA (WAN) (REDES DE AREA EXTENSA): Los nodos

- REDES DE AREA LOCAL (LAN): Los nodos ocupan el mismo edificio o

2.1 INTERCONEXION DE NODOS

- REDES EN BUS: están conectados a través del bus

- REDES EN MALLA: cada nodo esta conectado con todos.

- REDES EN ÁRBOL: no se suelan usar porque su estructura es muy

Las diferencias entre estos tipos de redes se deben a los siguientes

3. ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS

Existen varias formas de distribuir la información a través de los nodos de la

b) BASE DE DATOS PARTICIONADA: es la forma más simple de distribuir los datos

d) BASE DE DATOS CON ARCHIVOS DUPLICADOS EN NODOS SELECCIONADOS: es la más

4. VENTAJAS Y DESVENTAJAS DE LAS BASES DE DATOS

Las VENTAJAS son:

- Posibilidad de acceder a la información de otros nodos

Las DESVENTAJAS son:

- Coste del software.

TRANSACCIÓN se define una transacción como una secuencia de

En las bases de datos distribuidas la información esta compartida por varios

EJEMPLO: cajas de un supermercado

INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2

La solución a la actualización incorrecta es lo que se llama “CIERRE”.

CIERRE CON SEMÁFOROS

EJEMPLO: Cajas de un supermercado

INSTANTES DE CLIENTE CAJA 1 CLIENTE CAJA 2

Se anotan en el stock que quedan 95

El proceso sale de la cola. Se cierra el

T5 Se hacen las operaciones de cálculo.

Se anotan que quedan 85 unidades y

BLOQUEO MUTUO es consecuencia del uso de semáforos y NO tiene solución.

EJEMPLO: cajas de un supermercado (pero no es el mismo ejemplo) en este

INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2

La concurrencia o accesos concurrentes son los que provocan estos

En cuanto a seguridad de la base de datos vamos a tener dos niveles de

En una estructura cliente servidor el motor de la base de datos (aplicación) se

Hoy en día la mayoría de los servidores de información son servidores de

La potencia de la estructura o plataforma cliente/servidor radica en la

Características de un servidor de bases de datos moderno

Un servidor de bases de datos moderno deberá cumplir los siguientes

- Soportar algún protocolo TCP/IP.

• Almacén de datos • Almacén de datos

CLIENTES • Interfaz de usuario • Motor de la BD

También podría gustarte