Está en la página 1de 6

Bases de Datos

1. INTRODUCCIÓN

La forma de tratar los datos mediante un solo ordenador ha ido dejando paso a
la idea o posibilidad de que los datos se almacenen en varios equipos situados en
lugares diferentes.
Podemos decir que un sistema de bases de datos distribuidas será una base
de datos segmentada en varias localizaciones que están interconectadas a través de
una red. Cada punto o equipo de la base de datos se llama “NODO”.

2. ESTRUCTURA DE LAS BASES DE DATOS DISTRIBUIDAS

El hecho de que en una base de datos distribuida la información se


encuentre dispersa por varios nodos permite que se puedan realizar dos tipos
de transacciones:

TRANSACCIONES LOCALES: procesan información situada en el mismo nodo,


son fragmentos de programa que acceden a la parte local de una base
de datos.

TRANSACCIONES GLOBALES: procesan información situada en nodos


diferentes, son fragmentos de programa que acceden a partes de la
base de datos que se encuentran en otros nodos. En este segundo
caso requieren ordenadores interconectados entre si.

Según la situación geográfica la conexión entre nodos se realiza


mediante:

- REDES DE LARGA DISTANCIA (WAN) (REDES DE AREA EXTENSA): Los nodos


ocupan localidades diferentes distribuidas por el mismo país o por
países diferentes.

- REDES DE AREA LOCAL (LAN): Los nodos ocupan el mismo edificio o


edificios próximos situados en la misma localidad. Ejemplo: la de
clase.

2.1 INTERCONEXION DE NODOS

La unión entre los diferentes nodos puede hacerse de las siguientes maneras:

- REDES EN BUS: están conectados a través del bus

- REDES EN MALLA: cada nodo esta conectado con todos.

- REDES EN ÁRBOL: no se suelan usar porque su estructura es muy


complicada o compleja.

1
Bases de Datos

- REDES EN ANILLO

- REDES EN ESTRELLA: hay un nodo principal que gestiona toda la red, por
lo que si este falla nos quedamos sin red.

Las diferencias entre estos tipos de redes se deben a los siguientes


factores:
- Coste de instalación: que es la unión física entre los nodos,
dependerá del número de interconexiones, ya que cuantas más
haya será más caro.
- Coste de las comunicaciones: que será el coste en tiempo y en
dinero para acceder a la información en un nodo, dependerá de la
conexión física que tengamos entre los nodos.
- Confiabilidad: frecuencia con la que fallan las líneas.
- Disponibilidad: posibilidad de acceder a los datos a pesar de los
fallos que se puedan producir en los nodos o los fallos que se
puedan producir en las líneas de comunicación.

3. ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS

Existen varias formas de distribuir la información a través de los nodos de la


red, lo cual permite clasificar las bases de datos en los siguientes tipos:

a) BASE DE DATOS MULTIPLICADA: en esta base de datos todos los archivos están
duplicados en cada nodo con el fin de reducir los costes de comunicación y
el tiempo de respuesta. Presenta el inconveniente de la cantidad de
espacio necesario para su almacenamiento, mucha redundancia y
problemas de actualización.

b) BASE DE DATOS PARTICIONADA: es la forma más simple de distribuir los datos


en una red. Se reparten los archivos entre los distintos nodos evitándose la
duplicidad de datos. Presenta la ventaja de tener que actualizar solo un
archivo cada vez que se produce una transacción, pero cuando se desea
hacer una consulta que implica la necesidad de acceder a varios nodos
diferentes supone un aumento del coste de tiempo, un fallo en cualquier
nodo puede dejar a toda la red sin servicio.

c) BASE DE DATOS CON NODO CENTRAL: todos los archivos se ubican en un mismo
nodo, con este sistema se reducen los problemas de actualizaciones, pero
debe optimizarse el coste de las comunicaciones haciendo una elección
apropiada del nodo central. Si este nodo sufre un fallo toda la red puede
quedar inutilizada.

d) BASE DE DATOS CON ARCHIVOS DUPLICADOS EN NODOS SELECCIONADOS: es la más


flexible de todas las construcciones o tipos de bases de datos distribuidas.
Los archivos que se utilicen solo en un nodo se almacenan en él, y los
archivos que puedan ser requeridos por varios nodos se ubican en todos
ellos. Este sistema presenta problemas de actualización al estar duplicados
los archivos. Otro inconveniente es la búsqueda de datos que se
encuentran en nodos diferentes.

2
Bases de Datos

4. VENTAJAS Y DESVENTAJAS DE LAS BASES DE DATOS


DISTRIBUIDAS

Las VENTAJAS son:

- Posibilidad de acceder a la información de otros nodos


- Pueden agilizarse algunas consultas si parte de ellas se ejecutan en
otros nodos de forma paralela.
- Mayor eficiencia en el control de los datos que se usan con más
frecuencia en cada uno de los nodos.
- Confiabilidad. Cuando un nodo sufre un fallo no tiene porque dejar
de funcionar la base de datos (dependiendo del tipo de base de
datos distribuida que utilicemos).

Las DESVENTAJAS son:

- Coste del software.


- Coste de las comunicaciones, hay que conectar todos los nodos de
la red.
- Actualización de los datos duplicados.
- Mayor posibilidad de errores por el hecho de que varios nodos
puedan acceder al mismo dato.
- Complejidad del sistema.
- Mayor tiempo de procesamiento cuando se trata de transacciones
globales.

5. INTEGRIDAD Y SEGURIDAD

5.1 INTEGRIDAD

TRANSACCIÓN se define una transacción como una secuencia de


operaciones que se producen en un nodo de manera que cuando termina quedan
confirmadas todas las actualizaciones que ha realizado y preserva la integridad de la
base de datos. Si la transacción fuera abortada se debe anular todas las
actualizaciones que hubiera hecho.

En las bases de datos distribuidas la información esta compartida por varios


usuarios situados en distintos nodos o terminales, por ello puede darse el caso de que
dos o más usuarios distintos realicen transacciones sobre los mismos datos al mismo
tiempo. Esto produce dos problemas que son la actualización incorrecta y el bloqueo
mutuo.

3
Bases de Datos

Actualización incorrecta:

EJEMPLO: cajas de un supermercado

INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2


Adquiere 5 unidades del
T1 producto X. Para actualizar se
lee el stock y quedan 100.
Adquiere 10 unidades del
Se hacen las operaciones de
T2 producto X. Para actualizar se
cálculo.
lee el stock y quedan 100.
Se anotan en el stock que
T3 Se hacen operaciones de cálculo
quedan 95 (100-5) unidades
Se anota el en stock que quedan
T4 90 unidades (100-10), cuando
realmente quedan 85.

La solución a la actualización incorrecta es lo que se llama “CIERRE”.


El cierre consiste en poner un semáforo que estará cerrado cuando el registro o
dato correspondiente se esté actualizando, y el semáforo estará abierto en otro caso.

CIERRE CON SEMÁFOROS

EJEMPLO: Cajas de un supermercado

INSTANTES DE CLIENTE CAJA 1 CLIENTE CAJA 2


TIEMPO
El cliente adquiere 5 unidades del
producto X. Para actualizar se cierra
T1 el semáforo del registro (del producto
X, donde esta el stock del producto) y
se lee el stock y quedan 100.
El cliente adquiere 10 unidades del
producto X. Para actualizar el
T2 Se hacen las operaciones de cálculo. semáforo del producto X esta cerrado,
por lo que se pasa a la cola de
espera.

Se anotan en el stock que quedan 95


T3 unidades (100-5) y se abre el ESPERA
semáforo.

El proceso sale de la cola. Se cierra el


T4 semáforo del registro del producto X.
Se lee el stock y quedan 95 unidades.

T5 Se hacen las operaciones de cálculo.

Se anotan que quedan 85 unidades y


T6 se abre el semáforo del registro del
producto X.

4
Bases de Datos

El semáforo puede ser para un dato, para un fichero entero, para un archivo, o
incluso a la base de datos.

BLOQUEO MUTUO es consecuencia del uso de semáforos y NO tiene solución.

EJEMPLO: cajas de un supermercado (pero no es el mismo ejemplo) en este


caso el semáforo se pone a todo el archivo.

INSTANTES DE TIEMPO CLIENTE CAJA1 CLIENTE CAJA 2


El proceso accede al archivo El proceso accede al archivo
T1 ARTICULOS cerrando su CLIENTES cerrando su
semáforo. semáforo.
Se necesita acceder al archivo
ARTICULOS pero su semáforo
Se hacen las operaciones de
T2 esta cerrado, por tanto este
cálculo.
proceso2 pasa a la cola de
espera.
Se necesita acceder al fichero
CLIENTES, pero su semáforo
T3 esta cerrado, por tanto este
proceso1 pasa la cola de
espera.

La concurrencia o accesos concurrentes son los que provocan estos


dos tipos de problemas.

5.2 SEGURIDAD

En cuanto a seguridad de la base de datos vamos a tener dos niveles de


identificación:
- Un nivel para el acceso a los datos locales.
- Otro para transacciones globales.

6. ESTRUCTURAS CLIENTE/SERVIDOR

En una estructura cliente servidor el motor de la base de datos (aplicación) se


encuentra en un servidor central junto con el almacén de datos. El motor o servidor
puede dar servicio a varias aplicaciones cliente simultáneamente manipulando el
almacén de datos y devolviendo la información solicitada a cada aplicación local o
aplicación cliente.

Hoy en día la mayoría de los servidores de información son servidores de


bases de datos. El cliente no sabe gran cosa acerca de la manipulación y ubicación de
la información, así un cliente que quiere realizar una consulta o actualización de datos,
simplemente envía la petición al servidor, éste la tramita y devuelve los resultados.

5
Bases de Datos

La potencia de la estructura o plataforma cliente/servidor radica en la


concepción de la división de funciones. El cliente o usuario no se preocupa de nada,
salvo de hacer las peticiones. El servidor es el que gestiona el acceso a los datos,
realizando a la vez funciones de control y seguridad.

Características de un servidor de bases de datos moderno

Un servidor de bases de datos moderno deberá cumplir los siguientes


requisitos:

- Soportar algún protocolo TCP/IP.


- Permitir también la conexión a un elevado número de clientes.
- Permitir la manipulación de datos a través del lenguaje SQL.
- Permitir deshacer transacciones.
- Ofrecer la posibilidad de compartir datos que pertenezcan
físicamente a distintas bases de datos.

CLIENTE/SERVIDOR REMOTA

• Almacén de datos • Almacén de datos


• Motor de la BD

CLIENTES • Interfaz de usuario • Motor de la BD


• Interfaz de usuarios

También podría gustarte