Está en la página 1de 22

Bases de datos distribuidas

Filiberto Ruiz Hernández


Base de datos distribuida

� Es un conjunto de múltiples bases de datos lógicamente relacionadas, pero que se


encuentran distribuidas en diferentes espacios lógicos y de ubicación.
� Estas bases de datos pueden realizar procesamientos autónomos y operaciones locales o
distribuidas.
� Trabajan en un ambiente cliente/servidor.
� Las computadoras son llamadas sitios o nodos.
� Esta compuesta de un conjunto de sitios, conectados entre si, por medio de algún tipo de
red de comunicaciones
Base de datos distribuida
Base de datos distribuida

� Aplicaciones.
� En grandes empresas, las cuáles cuentan con diferentes departamentos y sucursales. Ej:
Organismos gubernamentales, la industria de la manufactura, cadenas hoteleras, líneas de
transportación aérea, servicios bancarios, servicios de paquetería, etc.
Base de datos distribuida

� Los ambientes mas comunes son:


� Homogéneos: Todos los sitios tienen el mismo SGBD, conocen la existencia de los demás sitios y
cooperan en el procesamiento de las transacciones.
� Heterogéneas: Cada sitio puede tener su propio SGBD con esquemas diferentes. No
necesariamente deben conocerse todos los sitios y puede llegar a ofrecer ayuda limitada en el
procesamiento de transacciones.
Base de datos distribuida

Funcionalidades del SGBDD (Sistema de Gestión de base de datos distribuidas)


� Accede a sitios remotos y transmite consultas y datos a través de varios sitios mediante una red de
comunicación.
� Almacena el esquema de distribución y replicación de los datos en el catalogo del sistema.
� Establece las estrategias de ejecución de las consultas y las transacciones que acceden a los datos
en más de un sitio.
� Decide sobre cual copia de los datos replicados acceder.
� Mantiene la consistencia de las copias de los datos replicados.
� Realiza la recuperación ante los fallos.
Base de datos distribuida

Componentes de un SGBDD:
� Hardware
� Software
� DDBMS(Sistema manejador de base de datos distribuida)
� DTM (Administrador de transacciones)
� SGBD (Sistema gestor de base de datos)
� Nodo. Computadora
Base de datos distribuida

Ventajas:
� Refleja una estructura organizacional – los fragmentos de la base de datos se ubican en los
departamentos a los que tienen relación.
� Autonomía local – un departamento puede controlar los datos que le pertenecen.
� Disponibilidad – un fallo en una parte del sistema solo afectará a un fragmento, en lugar de a toda
la base de datos.
� Rendimiento – los datos generalmente se ubican cerca del sitio con mayor demanda, también los
sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores.
� Economía – es más barato crear una red de muchas computadoras pequeñas, que tener una sola
computadora muy poderosa.
� Modularidad – se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin
afectar a los demás sistemas (módulos).
Base de datos distribuida

Desventajas:
� Complejidad – Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que
pueden presentar dificultades únicas. El diseño de la base de datos se tiene que trabajar tomando en cuenta su
naturaleza distribuida, por lo cual no podemos pensar en hacer joins que afecten varios sistemas.
� Economía – la complejidad y la infraestructura necesaria implica que se necesitará una mayor mano de obra.
� Seguridad – se debe trabajar en la seguridad de la infraestructura así como cada uno de los sistemas.
� Integridad – Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través de la red puede ser muy
caro en términos de transmisión de datos.
� Falta de experiencia – las bases de datos distribuidas son un campo relativamente nuevo y poco común por lo cual no
existe mucho personal con experiencia o conocimientos adecuados.
� Carencia de estándares – aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS
centralizado en un DBMS distribuido.
Base de datos distribuida

� Las 12 reglas de operación de las bases de datos distribuidas:


1. Autonomía local
2. No dependencia de un sitio central
3. Operación continua
4. Independencia con respecto a la localización
5. Independencia con respecto a la fragmentación
6. Independencia de réplica
Base de datos distribuida

� Las 12 reglas de operación de las bases de datos distribuidas:


7. Procesamiento distribuido de consultas
8. Manejo distribuido de transacciones
9. Independencia con respecto al equipo
10. Independencia con respecto al sistema operativo
11. Independencia con respecto a la red
12. Independencia con respecto al SGBD
Base de datos distribuida

� Autonomía
� Los sitios deben ser autónomos y no
depender de otro para su buen
funcionamiento.
Base de datos distribuida

� Independencia de un sitio central.


� No debe haber dependencia de un
servicio central, para evitar cuellos de
botella o vulnerabilidades.
Base de datos distribuida

� Operación continua.
� No debe haber necesidad de apagar el
sistema
Base de datos distribuida

� Independencia respecto a localización.


� No es necesario que los usuarios sepan
donde están almacenados físicamente los
datos.
Base de datos distribuida
Independencia respecto a
fragmentación. Independencia de replica.

� Pueden manejar fragmentación si es � Puede manejar réplica de datos si una


necesario dividir una relación en partes relación dada se puede representar en el
para propósitos de almacenamiento. nivel físico mediante varias copias
almacenadas, en distintos sitios.
Base de datos distribuida

� Procesamiento distribuido de consultas


� Optimización de consultas. El trabajo de la optimización de consulta local se efectúa en todos los
nodos con fragmentos involucrados en la consulta. Cada subconsulta que se ejecuta en un nodo,
es optimizada usando el esquema local del nodo.
� Mensajes. Se requiere un protocolo de comunicación de manera que los mensajes son el medio
por el cuál se pueden dar por iniciadas o terminadas las consultas.
Base de datos distribuida

� Manejo distribuido de transacciones


� Control de recuperación.
� Recuperaciones inconsistentes: acceder a información modificada parcialmente por una transacción.

� Control de concurrencia.
� Resolver el problema de las actualizaciones perdidas: cuando dos transacciones concurrentes borran el
efecto, una de la otra
Base de datos distribuida

� Independencia con respecto al equipo


� Puede estar compuesto de computadoras
de diferentes capacidades, de manera que
se representa como un solo equipo.
Base de datos distribuida

� Independencia con respecto al sistema


operativo
� Puede ser ejecutado en diferentes
sistemas operativos.
Base de datos distribuida

� Independencia con respecto a la red


� Puede trabajar en distintas redes de
comunicación
Base de datos distribuida

� Independencia con respecto al SGBD.


� Lo deseable es que sea homogéneo el uso
del gestor de base de datos, pero podrían
ser usados más de un SGBD.