Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos:
Bases de Datos Dist r ibuidas
NDICE
1.
2.
3.
4.
5.
Introduccin.
Almacenamiento distribuido de datos.
Transparencia de la red.
Procesamiento distribuido de
consultas.
Transacciones distribuidas.
1. Introduccin
Visin general
Los datos se encuentran en diferentes mquinas,
1. Introduccin
Nodo
NodoEUI
EUI
Alumnos
Comunicacin a
travs de la red
Nodo
NodoEUIT
EUIT
RED
Alumnos
Nodo
NodoRectorado
Rectorado
Escuelas
1. Introduccin
Escuela
Nota ingreso
Beca
Nombre
Situacin
Nmero alumnos
1. Introduccin
1. Introduccin
1. Introduccin
Rplica:
El sistema conserva varias copias o rplicas idnticas
Rplica:
Inconveniente:
Aumento de la sobrecarga en las
actualizaciones: El sistema debe asegurar que
todas las rplicas de la tabla sean consistentes.
Cuando se realiza una actualizacin sobre una
de las rplicas, los cambios deben propagarse a
todas las rplicas de dicha tabla a lo largo del
sistema distribuido.
Fragmentacin de datos
Fragmentacin horizontal:
Una tabla T se divide en subconjuntos, T , T ,
1
2
...Tn. Los fragmentos se definen a travs de una operacin
de seleccin y su reconstruccin se realizar con una
operacin de unin de los fragmentos componentes.
Cada fragmento se sita en un nodo.
Pueden existir fragmentos no disjuntos:
combinacin de fragmentacin y replicacin.
Fragmentacin de datos
Fragmentacin horizontal: Ejemplo.
Escuela
Nombre
Nota ingreso
Beca
87633483
EUI
Concha Queta
5.6
No
99855743
EUI
Josechu Letn
7.2
Si
33887293
EUIT
Oscar Romato
6.1
Si
05399075
EUI
Bill Gates
5.0
No
44343234
EUIT
Pepe Ptamo
8.0
No
44543324
EUI
Maite Clado
7.5
Si
66553234
EUIT
Ernesto Mate
6.6
No
Fragmentacin de datos
Fragmentacin horizontal: Ejemplo.
Escuela
Nombre
Nota ingreso
Beca
87633483
EUI
Concha Queta
5.6
No
99855743
EUI
Josechu Letn
7.2
Si
05399075
EUI
Bill Gates
5.0
No
44543324
EUI
Maite Clado
7.5
Si
Escuela
Nombre
Nota ingreso
Beca
33887293
EUIT
Oscar Romato
6.1
Si
44343234
EUIT
Pepe Ptamo
8.0
No
66553234
EUIT
Ernesto Mate
6.6
No
Fragmentacin de datos
Fragmentacin vertical:
Fragmentacin de datos
Fragmentacin vertical: Ejemplo
Departamento infraestructura
Escuela
EUI
EUIT
TOPOGRAFIA
ETSIT
FI
Escuela,Situacin(R)
Nmero alumnos
Campus sur
3000
Campus sur Departamento
2800ordenacin
Campus sur
800
Ciudad Universitaria
2500
Campus Montegancedo
2100
Escuela,Nmero_alumnos (R)
Situacin
Campus sur
Campus sur
Campus sur
Ciudad Universitaria
Campus Montegancedo
acadmica
Escuela
Nmero alumnos
EUI
EUIT
TOPOGRAFIA
ETSIT
3000
2800
800
2500
FI
2100
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
Fragmentacin de datos
Fragmentacin Mixta: Ejemplo
Secretara
DNI
87633483
99855743
05399075
44543324
Escuela
EUI
EUI
EUI
EUI
Nombre
Concha Queta
Josechu Letn
Bill Gates
Maite Clado
Beca
No
Si
No
Si
DNI,Escuela,Escuela,Nombre,Beca(E)
Escuela
EUI
EUI
EUI
EUI
Nombre
Concha Queta
Josechu Letn
Bill Gates
Maite Clado
DNI
87633483
99855743
05399075
44543324
Nota ingreso
5.6
7.2
5.0
7.5
Beca
No
Si
No
Si
DNI,Escuela,Nombre,Nota ingreso(E)
Escuela
Nombre
EUI
Concha Queta
EUI
Josechu Letn
EUI
Bill Gates
Jefatura estudios
EUI
Maite Clado
Resultante
Resultantede
de
fragmentacin
fragmentacin
horizontal
horizontalprevia
previa
Nota ingreso
5.6
7.2
5.0
7.5
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
3. Transparencia de la
red
rplicas.
3. Transparencia de la red
rplicas.
Nombre nico para cada elemento.
Denominacin centralizada de elementos
Problemas:
Cuello de botella para acceder a los nombres de los
elementos.
Si falla, es posible que ningn nodo siga funcionando.
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
3. Transparencia de la red
4. Procesamiento distribuido de
consultas
Se estudia el coste de las
comunicaciones.
Objetivo: la reduccin de la cantidad de
datos transferidos.
Optimizacin mediante operacin de
semijoin.
4. Procesamiento distribuido de
consultas
Ejemplo de consulta
distribuida
NODO1: EMPLEADO
Nombre
Apellido
COD
Dir
Sexo
Sueldo
fecha Nac.
Dpto.
10.000 tuplas.
Cada tupla tiene 100 bytes de longitud.
El campo COD tiene 9 bytes de longitud. El
campo Dpto tiene 4 bytes de longitud.
El campo Nombre tiene 15 bytes de longitud.
El campo Apellido tiene 15 bytes de longitud.
Tamao de la relacin: 100 * 10.000 = 106
bytes
4. Procesamiento distribuido de
consultas
NODO2: DEPARTAMENTO
NombreDpto
NDpto
Responsable
Edificio
100 tuplas.
Cada tupla tiene 35 bytes de longitud.
El campo NombreDpto tiene 10 bytes de longitud. El campo
NDpto tiene 4 bytes de longitud.
El campo Responsable tiene 9 bytes de longitud.
Tamao de la relacin: 35 * 100 = 3500 bytes
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
4. Procesamiento distribuido de
consultas
4. Procesamiento distribuido de
consultas
4. Procesamiento distribuido de
consultas
4. Procesamiento distribuido de
consultas
4. Procesamiento distribuido de
consultas
Ejemplos de consulta distribuida
director
Q2: NombreDPto,Nombre,Apellido(DEPARTAMENTO * EMPLEADO)
La consulta se lanza desde el nodo 3. El resultado de sta consulta
constar de 100 tuplas (4.000 bytes).
Opcin 1: transferimos las relaciones DEPARTAMENTO y EMPLEADO
al nodo 3. Se transfieren:
3.500 + 1.000.000 = 1.003.500 bytes.
Opcin 2: transferimos la relacin EMPLEADO al nodo 2 y enviamos el
desde el nodo 2.
La
Lasegunda
segundaopcin
opcines
esms
msoptima:
optima:origen
origendel
delsemijoin.
semijoin.
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
4. Procesamiento distribuido de
consultas
otro nodo.
Se enva la columna con la que se va a realizar el join de
una relacin R al nodo donde se encuentra la otra relacin,
all se realiza el join con la otra relacin S
Se envan las columnas implicadas en el resultado al nodo
inicial y se vuelve a realizar el join con R.
Slo se transfieren las columnas de R que intervienen en la
realizacin del join en una direccin y el subconjunto de
columnas de S resultantes en la otra.
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
4. Procesamiento distribuido de
consultas
4. Procesamiento distribuido de
consultas
Paso 2.
Consulta Q1: realizacin del join de los tuplas transferidas en el paso anterior.
Transferencia del resultado del join de nuevo al nodo 1. Se transfieren slo
los atributos necesarios para realizar el join final:
R1: Dpto,Nombre,Apellido(F * EMPLEADO) Tamao: (4 + 15 + 15) * 10.000 =
Total
Totaltransferido:
transferido:340.400
340.400bytes
bytespara
paraQ1
Q1yy4.800
4.800bytes
bytespara
paraQ2.
Q2.
Dpto. O.E.I . - U.P.M. /
Bases de Datos Distribuidas:
Recuperacin
Recuperacin
5. Transacciones distribuidas