Está en la página 1de 42

FUNDAMENTOS DE BASE DE DATOS

DISTRIBUIDAS
1.1 Conceptos Bsicos
Bases de Datos Distribuidas
Base de Datos Distribuida (BDD)


Una Base de Datos Distribuida (BDD) es un
conjunto de mltiples bases de datos lgicamente
relacionadas, las cuales se encuentran distribuidas
entre diferentes sitios interconectados por una red
de comunicaciones, los cuales tienen la capacidad
de procesamiento autnomo lo cual indica que
puede realizar operaciones locales o distribuidas.
Bases de Datos Distribuidas
Sistema de Bases de Datos Distribuida

Un sistema de Bases de Datos Distribuida (SBDD) es un
sistema en el cual:

Mltiples sitios de bases de datos estn ligados por
un sistema de comunicaciones. de tal forma que, un
usuario en cualquier sitio puede acceder los datos
en cualquier parte de la red exactamente como si los
datos estuvieran ah.
Bases de Datos Distribuidas
Por qu son necesarias las BDD?

La respuesta es que las empresas ya estn
generalmente distribuidas al menos de manera
lgica (en divisiones, departamentos, grupos de
trabajo, etc.)

Y es muy probable que tambin lo estn de
manera fsica (en plantas, fbricas, laboratorios,
etc.);
Bases de Datos Distribuidas

De esto deducimos que por lo general tambin los
datos ya estn distribuidos

Ya que cada unidad organizacional dentro de la
empresa mantendr los datos que son importantes
para su propia operacin

Por lo tanto, el valor de la informacin total de la
empresa est divido en lo que a veces llamamos
islas de informacin
Bases de Datos Distribuidas
Ventajas:

Lo que hace un Sistema Distribuido es
proporcionar los puentes necesarios para conectar
a esas islas entre s

En otras palabras, permite que la estructura de la
BD refleje la estructura de la empresa los datos
locales son conservados localmente en el lugar
donde pertenecen de manera ms lgica Y al
mismo tiempo, permite tener acceso a datos
remotos cuando sea necesario.
Bases de Datos Distribuidas
Ventajas:

El arreglo distribuido combina eficiencia de
procesamiento (los datos se mantienen cerca del
punto en donde se usan ms frecuentemente).

Con una mayor accesibilidad (es posible acceder
a una cuenta remota y viceversa, por medio de la
red de comunicaciones).

Probablemente el mayor beneficio de los sistemas
distribuidos es que permiten que la estructura de la
BD refleje la estructura de la empresa
Bases de Datos Distribuidas
Costo del desarrollo del software.
Complejidad, se debe asegurar que la base de datos sea
transparente.
Falta de experiencia, las BDD son un campo
relativamente nuevo y poco comn por lo cual no existe
muncho personal con experiencia o conocimientos
adecuados.

Bases de Datos Distribuidas
Ejemplos de algunos DDBMS :

Implementaciones comerciales:

La mayora de los productos SQL actuales
proporcionan algn tipo de soporte de BDD (con
diversos grados de funcionalidad).

Ingres/Star, el componente de BDD de Ingres
La opcin de BDD de Oracle
La propiedad de datos distribuidos de DB2
Bases de Datos Distribuidas
Principio Fundamental
Ante el usuario, un sistema distribuido debe lucir
exactamente igual que un sistema que no es
distribuido

En otras palabras, los usuarios de un sistema
distribuido deben ser capaces de comportarse
exactamente como si no fuera distribuido.

Todos los problemas de los sistemas distribuidos
son, o deberan ser, problemas internos o en el
nivel de implementacin, y no externos o en el
nivel de usuario.
1.2 Objetivos de las BDD
Bases de Datos Distribuidas
El principio fundamental nos conduce a 12 reglas u
objetivos:

1.- Autonoma local. Los sitios en un sistema
distribuido deben ser autnomos.

La autonoma local significa que todas las operaciones en
un sitio dado estn controladas por ese sitio; ningn sitio
X debe depender de algn otro sitio Y para su operacin
satisfactoria.

La seguridad, integridad y representacin de
almacenamiento de los datos locales permanecen bajo el
control y jurisdiccin del sitio local.
Bases de Datos Distribuidas
12 reglas u objetivos:
2.- No dependencia de un sitio central. La autonoma
local implica que todos los sitios deben ser tratados
como iguales.

Por lo tanto, no debe haber particularmente ninguna
dependencia de un sitio maestro central para algn
servicio central, tal que todo el sistema dependa de ese
sitio central.

Razones por las cuales no debera haber un sitio central:
El sitio central puede ser un cuello de botella

El sistema sera vulnerable; es decir, si el sitio central
falla, tambin fallar todo el sistema
Bases de Datos Distribuidas
12 reglas u objetivos:

3.- Operacin continua. Una ventaja de los sistemas
distribuidos es que deben proporcionar mayor
confiabilidad y mayor disponibilidad.


Confiabilidad. La probabilidad de que el sistema est
listo y funcionando en cualquier momento dado. Los SD
no son una propuesta de todo o nada; pueden continuar
operando cuando hay alguna falla en algn componente
independiente.

Disponibilidad. La probabilidad de que el sistema est
listo y funcionando continuamente a lo largo de un perodo
especificado.
Bases de Datos Distribuidas
12 reglas u objetivos:

4.- Independencia de ubicacin. Conocida tambin
como transparencia de ubicacin.

Los usuarios no tienen que saber dnde estn
almacenados fsicamente los datos, sino que deben ser
capaces de comportarse como si todos los datos
estuvieran almacenados en su propio sitio local.

Esto simplifica los programas de los usuarios. En
particular, permite que los datos emigren de un sitio a otro
sin invalidar ninguno de estos programas o actividades.
Bases de Datos Distribuidas
12 reglas u objetivos:
5.- Independencia de fragmentacin. Un sistema
soporta la fragmentacin de datos cuando puede
ser dividida en o partes o fragmentos, para efectos
de almacenamiento fsico.

La fragmentacin es necesaria por razones de
rendimiento: los datos pueden estar almacenados en la
ubicacin donde son usados ms frecuentemente para
que la mayora de las operaciones sean locales y se
reduzca el trfico en la red.

Los usuarios deben comportarse como si los datos en
realidad estuvieran sin fragmentacin alguna.
Bases de Datos Distribuidas
12 reglas u objetivos:
6.- Independencia de replicacin. El sistema soporta
replicacin de datos cuando un fragmento puede
ser representado por muchas copias distintas, o
rplicas, guardadas en muchos sitios distintos.

Las rplicas son necesarias por dos razones
principales:


1. Significan un mejor rendimiento.
Bases de Datos Distribuidas
12 reglas u objetivos:
6.- Independencia de replicacin

2. Pueden significar una mejor disponibilidad (un
objeto replicado permanece disponible para su
procesamiento, mientras est disponible al
menos una copia).

Por supuesto, la principal desventaja de las rplicas es
que al actualizarlas es necesario actualizar todas:
el problema de la propagacin de la
actualizacin.
Bases de Datos Distribuidas
12 reglas u objetivos:

7.- Procesamiento de consultas distribuidas. La
optimizacin es importante en un sistema
distribuido que en uno centralizado, incluso mucho
ms.

El punto bsico es que en una consulta que involucra a
varios sitios, habr muchas formas posibles de mover los
datos en el sistema para satisfacer la solicitud, y es
crucialmente importante que se encuentre una estrategia
eficiente.
Bases de Datos Distribuidas
12 reglas u objetivos:

8.- Administracin de transacciones distribuidas.
Existen dos aspectos principales en la
administracin de transacciones: control de
recuperacin y control de la concurrencia.

Ambos aspectos requieren un tratamiento amplio en el
ambiente distribuido.

Ya que una sola transaccin puede involucrar la ejecucin
de cdigo en muchos sitios.
Bases de Datos Distribuidas
12 reglas u objetivos:

9.- Independencia de hardware. Soporte para un gran
nmero de mquinas diferentes. Poder integrar
todos los datos de todos estos sistemas y
presentar al usuario una imagen del sistema
nico.

10.-Independencia de sistema operativo. Obviamente
es necesario no slo tener la posibilidad de
ejecutar el mismo DBMS en diferentes plataformas
de hardware, sino tambin ejecutarlo en diferentes
plataformas de sistema operativo.
Bases de Datos Distribuidas
12 reglas u objetivos:

11.- Independencia de red.

Si el sistema va a tener la posibilidad de soportar
muchos sitios distintos es obviamente necesario
tener la posibilidad de soportar tambin una
variedad de redes de comunicacin distintas.
Bases de Datos Distribuidas
12 reglas u objetivos:

12.- Independencia de DBMS. Lo que se necesita es
que todos los ejemplares de DBMS en sitios
diferentes soporten la misma interfaz.

Aunque no tienen que ser necesariamente copias del
mismo software DBMS.

En otras palabras, sera posible que el sistema distribuido
fuera heterogneo, al menos en cierto grado.

Sera muy bueno si diferentes DBMS pudieran participar
de alguna forma en un sistema distribuido.
1.3 Disciplinas Estudio
Bases de Datos Distribuidas
Como principales disciplinas de estudio para conocer las
bases de datos tenemos las siguientes:

A) INGENIERIA: Para conocer como se desarrollan y que
forma tendrn para implementarse.

B) ALGEBRA: Buscando establecer relaciones en base a
funciones algebraicas.

C) BASES DE DATOS: Buscando un adecuado
funcionamiento de acuerdo a los principios de estas.

D) REDES: Implementado en adecuado sistema para su
funcionamiento sin concurrencia.
Bases de Datos Distribuidas
Hospitales
Comercios
Bancos
Proceso comercial
Proceso educativo
Farmacias

ARQUITECTURA DE BASES DE
DATOS DISTRIBUIDAS
Bases de Datos Distribuidas
ARQUITECTURA GENERAL DE BASES DE
DATOS
Podemos destacar tres niveles principales segn la visin y la
funcin que realice el usuario sobre la base de datos:

Nivel Interno: es el nivel ms cercano al almacenamiento fsico
de los datos. Permite escribirlos tal y como estn almacenados
en el ordenador. En este nivel se disean los archivos que
contienen la informacin, la ubicacin de los mismos y su
organizacin, es decir se crean los archivos de configuracin.

Nivel conceptual: En este nivel se representan los datos que se
van a utilizar sin tener en cuenta aspectos como lo que
representamos en el nivel interno.


Bases de Datos Distribuidas
Nivel externo: es el ms cercano al usuario. En este nivel
se describen los datos o parte de los datos que ms
interesan a los usuarios.
Estos tres niveles de visin de usuarios los proporcionan los
sistemas gestores de base de datos.

Bases de Datos Distribuidas
La mayora de los sistemas de manejo de bases de
datos disponibles actualmente estn basadas en la
arquitectura ANSI-SPARC la cual divide a un sistema
en tres niveles: interno, conceptual y externo.
Bases de Datos Distribuidas
La arquitectura define la estructura de un sistema.
Al definir la arquitectura se deben identificar las
componentes de un sistema, las funciones que
realiza cada una de las componentes y las
interrelaciones e interacciones entre cada
componente.

Desde el punto de vista de las bases de datos,
conceptualmente existen tres tipos de ambientes
que se integran con mltiples procesadores:

Bases de Datos Distribuidas
1. Arquitectura de memoria
compartida.
Consisten de diversos procesadores los cuales accedan
una misma memoria y un misma unidad de
almacenamiento (uno o varios discos).
Bases de Datos Distribuidas
2. Arquitecturas de disco
compartido.
Consiste de diversos procesadores cada uno de ellos
con su memoria local pero compartiendo una misma
unidad de almacenamiento (uno o varios discos).
Bases de Datos Distribuidas
3. Arquitecturas nada
compartido.
Consiste de diversos procesadores cada uno con su
propia memoria y su propia unidad de
almacenamiento.
Bases de Datos Distribuidas
Desafortunadamente, no existe un equivalente de una
arquitectura estndar para sistemas de manejo de bases de datos
distribuidas. La tecnologa y prototipos de SMBDD se han
desarrollado ms o menos en forma independiente uno de otro y
cada sistema ha adoptado su propia arquitectura.


Bases de Datos Distribuidas
Para definir un esquema de estandarizacin en bases de datos
distribuidas se debe definir un modelo de referencia el cual sera
un marco de trabajo conceptual cuyo propsito es dividir el trabajo
de estandarizacin en piezas manejables y mostrar a un nivel
general como esas piezas se relacionan unas con otras. Para definir
ese modelo de referencia se puede seguir uno de los siguientes tres
enfoques:

Bases de Datos Distribuidas
1. Basado en
componentes.
Se definen las componentes del sistema junto con las relaciones
entre ellas. As, un SMBD consiste de un nmero de
componentes, cada uno de los cuales proporciona alguna
funcionalidad.

Bases de Datos Distribuidas
2. Basado en funciones.
Se identifican las diferentes clases de usuarios junto con
la funcionalidad que el sistema ofrecer para cada clase.
La especificacin del sistema en esta categora
tpicamente determina una estructura jerrquica para las
clases de usuarios.
La ventaja de este enfoque funcional es la claridad con la
cual se especifican los objetivos del sistema. Sin embargo,
este enfoque no proporciona una forma de alcanzar los
objetivos.

Bases de Datos Distribuidas
3. Basado en datos.
Se identifican los diferentes tipos de descripcin de datos
y se especifica un marco de trabajo arquitectural el cual
define las unidades funcionales que realizarn y/o usarn
los datos de acuerdo con las diferentes vistas.

Bases de Datos Distribuidas
La ventaja de este enfoque es la importancia que asigna al
manejo de datos. Este es un enfoque significativo para los
SMBD dado que su propsito principal es manejar datos. Sin
embargo, la desventaja de este enfoque es que es prcticamente
imposible especificar un modelo arquitectural sin especificar los
modelos para cada una de sus unidades funcionales. Este es el
enfoque seguido por el modelo ANSI/SPARC.
Bases de Datos Distribuidas

También podría gustarte

  • Grua Mecanica Controlada Por Kinect
    Grua Mecanica Controlada Por Kinect
    Documento1 página
    Grua Mecanica Controlada Por Kinect
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • 63 231 1 PB PDF
    63 231 1 PB PDF
    Documento10 páginas
    63 231 1 PB PDF
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Brasil 2014
    Brasil 2014
    Documento2 páginas
    Brasil 2014
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Algoritmos 50 Ejemplos
    Algoritmos 50 Ejemplos
    Documento37 páginas
    Algoritmos 50 Ejemplos
    jaeo0078
    Aún no hay calificaciones
  • PROPUESTA
    PROPUESTA
    Documento5 páginas
    PROPUESTA
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Basededatosdistribuida
    Basededatosdistribuida
    Documento6 páginas
    Basededatosdistribuida
    Gustavo Cartas
    Aún no hay calificaciones
  • Brasil 2014
    Brasil 2014
    Documento2 páginas
    Brasil 2014
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Laboratorio Matematico
    Laboratorio Matematico
    Documento42 páginas
    Laboratorio Matematico
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Requisitos
    Requisitos
    Documento1 página
    Requisitos
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Nagios
    Nagios
    Documento6 páginas
    Nagios
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Calendario Escolar Enero Julio2013
    Calendario Escolar Enero Julio2013
    Documento1 página
    Calendario Escolar Enero Julio2013
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • ISC-Redes de Computadoras PDF
    ISC-Redes de Computadoras PDF
    Documento4 páginas
    ISC-Redes de Computadoras PDF
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Nuevo Documento de Texto
    Nuevo Documento de Texto
    Documento1 página
    Nuevo Documento de Texto
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Unidad 1
    Unidad 1
    Documento42 páginas
    Unidad 1
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • Biblio
    Biblio
    Documento1 página
    Biblio
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • ISC-Redes de Computadoras PDF
    ISC-Redes de Computadoras PDF
    Documento4 páginas
    ISC-Redes de Computadoras PDF
    Eleazar Jimenez Garcia
    Aún no hay calificaciones
  • ISC-Redes de Computadoras PDF
    ISC-Redes de Computadoras PDF
    Documento4 páginas
    ISC-Redes de Computadoras PDF
    Eleazar Jimenez Garcia
    Aún no hay calificaciones