Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos Distribuidas: M. en C. Anastacio Antolino Hernández
Bases de Datos Distribuidas: M. en C. Anastacio Antolino Hernández
Definicin:
Consiste en una coleccin de sitios, conectados por medio de algn tipo de red de comunicacin, en el cual
Cada sitio es un sistema de BD completo por derecho propio, pero Los sitios ha acordado trabajar juntos, a fin de que un usuario de cualquier sitio pueda acceder a los datos desde cualquier lugar de la red, exactamente como si los datos estuvieran guardados en el propio sitio del usuario.
Definicin:
Una BDD es en realidad un tipo de BD virtual cuyas partes componentes estn almacenadas en varias BD reales distintas que se encuentran en varios sitios distintos (de hecho, es la unin lgica de esas BD reales).
Definicin:
Definicin:
Es comn suponer que los sitios componentes estn dispersos fsicamente quiz tambin dispersos geogrficamente -, aunque de hecho basta con que estn dispersos lgicamente.
Dos sitios pueden incluso coexistir en la misma mquina fsica.
Ventajas:
Y es muy probable que tambin lo estn de manera fsica (en plantas, fbricas, laboratorios, etc.);
Ventajas:
De esto deducimos que por lo general tambin los datos ya estn distribuidos
Ya que cada unidad organizacional dentro de la empresa mantendr los datos que son importantes para su propia operacin
Por lo tanto, el valor de la informacin total de la empresa est divido en lo que a veces llamamos islas de informacin
Ventajas: Lo que hace un Sistema Distribuido es proporcionar los puentes necesarios para conectar a esas islas entre s En otras palabras, permite que la estructura de la BD refleje la estructura de la empresa los datos locales son conservados localmente en el lugar donde pertenecen de manera ms lgica Y al mismo tiempo, permite tener acceso a datos remotos cuando sea necesario.
Ventajas: El arreglo distribuido combina eficiencia de procesamiento (los datos se mantienen cerca del punto en donde se usan ms frecuentemente). Con una mayor accesibilidad (es posible acceder a una cuenta remota y viceversa, por medio de la red de comunicaciones). Probablemente el mayor beneficio de los sistemas distribuidos es que permiten que la estructura de la BD refleje la estructura de la empresa
M. en C. Anastacio Antolino Hernndez
Desventajas: La mayor desventaja es el hecho de que los sistemas distribuidos son complejos (al menos desde el punto de vista tcnico). Por supuesto, de manera ideal esa complejidad debe ser problema del implementador y no del usuario. Pero es probable que algunos aspectos aparecern ante los usuarios, a menos que se tomen precauciones muy cuidadosas.
Prototipos SDD-1, que fue construido en la divisin de investigacin de Computer Corporation of America.
Finales de los aos 70 y principios de los 80.
R*, una versin distribuida del prototipo System R, construida en IBM Research
Principios de los aos 80
Distributed Ingres, una versin distribuida del prototipo Ingres, construida en la Universidad de California en Berkeley
Principios de los 80
Ejemplos de algunos DDBMS : Implementaciones comerciales: La mayora de los productos SQL actuales proporcionan algn tipo de soporte de BDD (con diversos grados de funcionalidad).
Ingres/Star, el componente de BDD de Ingres La opcin de BDD de Oracle La propiedad de datos distribuidos de DB2
Ejemplos de algunos DDBMS: Tanto los DDBMS prototipos como los productos, son relacionales (al menos todos soportan SQL).
Adems, hay varias razones por las cuales, para que un sistema distribuido sea exitoso, debe ser relacional.
La tecnologa relacional es un requisito previo para tecnologa distribuida
Principio Fundamental
Ante el usuario, un sistema distribuido debe lucir exactamente igual que un sistema que no es distribuido En otras palabras, los usuarios de un sistema distribuido deben ser capaces de comportarse exactamente como si no fuera distribuido.
Todos los problemas de los sistemas distribuidos son, o deberan ser, problemas internos o en el nivel de implementacin, y no externos o en el nivel de usuario.
El principio fundamental nos conduce a 12 reglas u objetivos: 1.- Autonoma local. Los sitios en un sistema distribuido deben ser autnomos.
La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. La seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el control y jurisdiccin del sitio local.
12 reglas u objetivos:
2.- No dependencia de un sitio central. La autonoma local implica que todos los sitios deben ser tratados como iguales.
Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central.
Razones por las cuales no debera haber un sitio central: El sitio central puede ser un cuello de botella
El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema
12 reglas u objetivos: 3.- Operacin continua. Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad.
Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn componente independiente. Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado.
12 reglas u objetivos: 4.- Independencia de ubicacin. Conocida tambin como transparencia de ubicacin.
Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local.
Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades.
12 reglas u objetivos:
5.- Independencia de fragmentacin. Un sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico.
La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna.
12 reglas u objetivos:
6.- Independencia de replicacin. El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos.
Las rplicas son principales: necesarias por dos razones
1. Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos)
12 reglas u objetivos:
12 reglas u objetivos: 7.- Procesamiento de consultas distribuidas. La optimizacin es importante en un sistema distribuido que en uno centralizado, incluso mucho ms.
El punto bsico es que en una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente.
12 reglas u objetivos: 8.- Administracin de transacciones distribuidas. Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia.
Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. Ya que una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios.
12 reglas u objetivos: 9.- Independencia de hardware. Soporte para un gran nmero de mquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una imagen del sistema nico. 10.Independencia de sistema operativo. Obviamente es necesario no slo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo.
12 reglas u objetivos: 11.- Independencia de red. Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar tambin una variedad de redes de comunicacin distintas.
12 reglas u objetivos: 12.- Independencia de DBMS. Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz.
Aunque no tienen que ser necesariamente copias del mismo software DBMS. En otras palabras, sera posible que el sistema distribuido fuera heterogneo, al menos en cierto grado. Sera muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.