Documentos de Académico
Documentos de Profesional
Documentos de Cultura
12
12
NDICE
1. 2. 3. 4. 5.
Introduccin. Almacenamiento distribuido de datos. Transparencia de la red. Procesamiento distribuido de consultas. Transacciones distribuidas.
1. Introduccin
Visin general
Los datos se encuentran en diferentes mquinas, generalmente situados en localizaciones geogrficas diferentes (homogneas o no). Nodo o emplazamiento: Cada uno de los ordenadores que integran el sistema de Bases de Datos distribuido. Tipos de transacciones:
Locales: cuando se accede a los datos del nico emplazamiento donde se inici la transaccin. Globales: Cuando se accede a datos de emplazamientos distintos al nodo donde se inici la transaccin.
1. Introduccin
Visin general. Ejemplo de BD distribuida:
Nodo EUI Nodo EUI Alumnos Nodo EUIT Nodo EUIT
RED
Alumnos
1. Introduccin
Visin general. Ejemplo de BD distribuida: Nodos de las Escuelas:
DNI Escuela Nombre Nota ingreso Beca
Nuevo alumno en la secretara del centro: transaccin local. Nuevo alumno en el rectorado: transaccin global
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 5
1. Introduccin
Visin general. Ejemplo de BD distribuida:
Este sistema ser distribuido si cumple que: Los distintos nodos estn informados sobre los dems. Aunque algunas tablas estn almacenadas slo en algunos nodos, stos comparten un esquema global comn. Cada nodo proporciona un entorno de ejecucin de transacciones, tanto local, como global. Generalmente, los nodos ejecutan el mismo software de gestin distribuida. En caso contrario se dice que el sistema es heterogneo.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 6
1. Introduccin
Ventajas de las Bases de Datos Distribuidas
Compartimiento de datos. Los usuarios de un nodo son capaces de acceder a los datos de otro nodo. Por ejemplo, desde el Rectorado, se puede consultar los datos de los alumnos de Informtica. Autonoma. Cada nodo tiene cierto grado de control sobre sus datos, en un sistema centralizado, hay un administrador del sistema responsable de los datos a nivel global. Cada administrador local puede tener un nivel de autonoma local diferente. Disponibilidad. Si en un sistema distribuido falla un nodo, los nodos restantes pueden seguir funcionando. Si se duplican los datos en varios nodos, la transaccin que necesite un determinado dato puede encontrarlo en cualquiera de los diferentes nodos.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 7
1. Introduccin
Inconvenientes de la Bases de Datos Distribuidas
Coste de desarrollo del software. La complejidad aadida que es necesaria para mantener la coordinacin entre nodos hace que el desarrollo de software sea ms costoso. Mayor probabilidad de errores. Como los nodos que constituyen el sistema funcionan en paralelo, es ms difcil asegurar el funcionamiento correcto de los algoritmos, as como de los procedimientos de recuperacin de fallos del sistema. Mayor sobrecarga de procesamiento. El intercambio de mensajes y ejecucin de algoritmos para el mantenimiento de la coordinacin entre nodos supone una sobrecarga que no se da en los sistemas centralizados.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 8
Escuela,Situacin(R)
Datos Rectorado (R)
Escuela
EUI EUIT TOPOGRAFIA ETSIT FI Situacin Campus sur Campus sur Campus sur Ciudad Universitaria Campus Montegancedo Nmero alumnos 3000 2800 800 2500 2100
Situacin Campus sur Campus sur Campus sur Ciudad Universitaria Campus Montegancedo
Escuela,Nmero_alumnos(R)
DNI,Escuela,Escuela,Nombre,Beca(E)
Nota ingreso 5.6 7.2 5.0 7.5 Beca No Si No Si
3. Transparencia de la red
Se apoya en los siguientes aspectos:
La denominacin de los elementos de datos. La rplica de los elementos de datos. La fragmentacin de los elementos de datos. La ubicacin de los fragmentos y las rplicas.
3. Transparencia de la red
Denominacin de los elementos de datos
Elementos de datos: relaciones, fragmentos y rplicas. Nombre nico para cada elemento. Denominacin centralizada de elementos
Servidor de nombres central en el que se registren los elementos. Servidor de nombres que direcciona los elementos. Problemas:
Cuello de botella para acceder a los nombres de los elementos. Si falla, es posible que ningn nodo siga funcionando.
3. Transparencia de la red
Denominacin de los elementos de datos
Denominacin distribuida de fragmentos:
Cada elemento tiene como prefijo el nodo en el que se encuentra. Se pierde transparencia de la red. Sistema de alias para recuperar la transparencia. Las tablas de conversin de alias deben estar en todos los nodos. Cada fragmento y rplica debe ser identificado de forma nica mediante sufijos. Ejemplo: EUI.ALUMNOS.f3.r2 hace referencia a la rplica 2 del fragmento 3 del elemento ALUMNOS del nodo EUI. Existir una tabla en el catlogo que permita al sistema determinar en qu Existir una tabla en el catlogo que permita al sistema determinar en qu fragmentos oorplicas estn los datos que el usuario solicita yymantendr las fragmentos rplicas estn los datos que el usuario solicita mantendr las rplicas actualizadas cuando se produzca una sentencia que modifique los datos. rplicas actualizadas cuando se produzca una sentencia que modifique los datos.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 20
Nombre
Apellido
COD
Dir
Sexo
Sueldo
fecha Nac.
Dpto.
10.000 tuplas. Cada tupla tiene 100 bytes de longitud. El campo COD tiene 9 bytes de longitud. El campo Dpto tiene 4 bytes de longitud. El campo Nombre tiene 15 bytes de longitud. El campo Apellido tiene 15 bytes de longitud. Tamao de la relacin: 100 * 10.000 = 106 bytes
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 22
NombreDpto
NDpto
Responsable
Edificio
100 tuplas. Cada tupla tiene 35 bytes de longitud. El campo NombreDpto tiene 10 bytes de longitud. El campo NDpto tiene 4 bytes de longitud. El campo Responsable tiene 9 bytes de longitud. Tamao de la relacin: 35 * 100 = 3500 bytes
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 23
Opcin 2: transferimos la relacin EMPLEADO al nodo 2 y enviamos el resultado del join al nodo 3. Se transfieren:
1.000.000 + 4.000 = 1.004.000 bytes.
Opcin 3: transferimos la relacin DEPARTAMENTO al nodo 1 y enviamos el resultado del join al nodo 3. Se transfieren en este caso:
3.500 + 4.000 = 7.500 bytes.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 28
La segunda opcin es ms optima: origen del semijoin. La segunda opcin es ms optima: origen del semijoin.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 29
Total transferido: 340.400 bytes para Q1 y 4.800 bytes para Q2. Total transferido: 340.400 bytes para Q1 y 4.800 bytes para Q2.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 32
Recuperacin
Fallo de los nodos.
Cuando un nodo falla, el sistema deber continuar trabajando con los nodos que an funcionan. Si el nodo a recuperar es una base de datos local, se debern separar los datos entre los nodos restantes antes de volver a unir de nuevo el sistema.
Recuperacin
Transaccin distribuida correcta.
Se pueden producir fallos durante la ejecucin de una transaccin correcta si se plantea el caso de que al acceder a alguno de los nodos que intervienen en la transaccin, dicho nodo falla.
5. Transacciones distribuidas
Protocolo de compromiso en dos fases. (Two phase commit
protocol) 1. El coordinador enva una solicitud de voto (vote request) a los nodos
participantes en la ejecucin de la transaccin. 2. Cuando los participantes reciben la solicitud de voto, responden enviando al coordinador un mensaje con su voto (S o No). Si un participante vota No, la transaccin se aborta (abort). 3. El coordinador recoge los mensajes con los votos de todos los participantes. Si todos han votado S, entonces el coordinador tambin vota si y enva un mensaje commit a todos los participantes. En otro caso, el coordinador decide abandonar y enva un mensaje abort a todos los participantes que han votado afirmativamente. 4. Cada participante que ha votado s, espera del coordinador un mensaje commit o abort para terminar la transaccin de forma normal o abortarla.
Dpto. O.E.I. - U.P.M. / Bases de Datos Distribuidas: 35