Está en la página 1de 24

Base de datos distribuidas

Concepto:
• "Base de datos distribuida" es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan físicamente en varias bases de datos "reales" distintas ubicadas en diferentes sitios. De hecho, es la unión lógica de esas bases de datos.

donde cada sitio de la red tiene capacidad de procesamiento autónomo y puede ejecutar aplicaciones locales.Concepto de BD Distribuida • Una base de datos distribuida es una colección de datos distribuidos en diferentes computadores de una red. . usando un subsistema de comunicación. • Además cada sitio participa en la ejecución de al menos una aplicación global que requiera acceder datos en diferentes sitios.

grupos. Son muy complejos. La información se mantiene en un solo lugar. Permite un distribución en las empresas. producen más retardo en las datos. dada su simplicidad en relación a una BD distribuida. de donde todos deben extraerla. Ejecución de algunas consultas en paralelo ó sobre un menor volúmen de Las consultas dada su estructura monolítica. y requieren un estudio profundizado en el lugar donde se las va a implantar El estudio. El costo de implantación es mucho mas elevado. pero eso no indica que se sigan desarrollando Reducción de redundancia: una sola copia de datos que se comparta Estructuras físicas complejas para accesos eficientes Seguridad Su estudio es muy profundizado. No se puede adecuar al crecimiento. dada su repartición en varias La accesibilidad muestra ciertos inconvenientes. como requerir más personal por ejemplo. que producen en el mayor pequeñas o medianas “partes” de los casos retrasos. Existe accesibilidad de mucha facilidad. Los costos son mucho más bajos. en el caso de la implantación puede ser somero. en una manera jerárquica: divisiones. . departamentos. dado que la implantación no requiere mucho personal.Comparación DISTRIBUIDAS CENTRALIZADAS Transparencia en la Distribución: Localización de los datos es un aspecto Independencia de Datos: Organización de los datos es transparente para el adicional de independencia de datos programador Replicación de Datos: copias múltiples de datos que incrementa la localidad y la disponibilidad de datos No hay estructuras intersitios. consultas Crecimiento : Más facil adecuarse al crecimiento de la Organización. dado que tan solo esta en un ordenador. Uso de optimización global para reducir transferencia de datos Problemas de seguridad intrínsecos Se cuenta con poca experiencia en su estudio. y de por sí es base para las BD distribuidas.

MOTIVACION • USUARIOS: Demandaron una serie de capacidades que han sido incorporadas en los sistemas de base de datos. .1. • TECNOLOGIA: Han posibles que algunas facilidades se hagan realidad.

LA PRECION POR DATOS DISTRIBUIDOS • LA PRESION DE LOS USUARIOS • Primera fase:  Se agrupo la información en un solo lugar. .  Grandes inversiones por parte de las organizaciones en equipos computacionales.  Todos los accesos podrían ser integrados en un solo lugar.  Los usuarios no obtenía un servicio optimo.  Se baso en un sistema centralizado. perdían el control de la misma ya que no se almacenaba en sus lugares de trabajo.  Los propietarios u organizadores de la información.

Problemas de consistencia de la información en los sistemas locales y central. Control de seguridad y disponibilidad de la misma. Adquirieron hardware y software departamentales. . Dificultades al transmitir información entre departamentos.LA PRECION POR DATOS DISTRIBUIDOS • Segunda fase: Promovió la descentralización de los sistemas de base de datos corporativos.

LA PRECION POR DATOS DISTRIBUIDOS • Segunda fase:  Formalizar la descentralización de las bases de datos y de sus funciones manteniendo la integridad de la información y quizás algún tipo de control centralizado o distribuido .

 Buenos rendimientos. punto de vista tecnológico:  Permitir autonomía local y promover la evolución de los sistemas. .LA PRESION DE LA TECNOLOGIA • Descentralización de la información.  Cambios en los requerimientos de los usuarios  Proveer una arquitectura de sistemas simple.

. Transformar datos e integrar tipos de procedimientos.LA PRESION DE LA TECNOLOGIA • Dificultades tecnológicas: Accesos entre diferentes nodos. Controlar el acceso a los datos disponibles en el ambiente distribuido Soportar la recuperación de errores de diferentes módulos del sistema de manera segura Los sistemas locales y globales sean una imagen fiel del mundo real. Distribuir datos en los nodos del ambiente distribuido de manera optima.

LA PRESION DE LA TECNOLOGIA • Dificultades de índole organizacional y de usuarios Modelos para estimar la capacidad y el trafico. Soportar el diseño de sistemas de sistemas de información distribuidas. Competencia de recursos entre nodos .

donde se intercambian informacion de otras areas. permite la integracion de datos no necesariamente homogeneos para dar un vision global de la inforamcion disponible. .HETEROGENIEDAD Y LA PRESION PARA INTEGRA DATOS • Integracios de necesidades de procesamientos no locales.

SISTEMAS DE BASE DE DATOS DISTRIBUIDAS • Sistema manejador de base de datos distribuida (DDBMS) Este sistema está formado por las transacciones y los administradores de la base de datos distribuidos. . estos programas pueden ser subsistemas de un único DDBMS de un fabricante o podría consistir de una colección de programas de diferentes fuentes. Un DDBMS implica un conjunto de programas que operan en diversas computadoras.

SISTEMAS DE BASE DE DATOS DISTRIBUIDAS .

un fallo en una parte del sistema solo afectará a un fragmento.se pueden modificar. ▫ Autonomía local . ▫ Disponibilidad . ▫ Rendimiento .Ventajas ▫ Refleja una estructura organizacional . ▫ Modularidad . que tener una sola computadora muy poderosa.un departamento puede controlar los datos que le pertenecen.los fragmentos de la base de datos se ubican en los departamentos a los que tienen relación. agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos).los datos generalmente se ubican cerca del sitio con mayor demanda. .es más barato crear una red de muchas computadoras pequeñas. ▫ Economía . también los sistemas trabajan en paralelo. en lugar de a toda la base de datos. lo cual permite balancear la carga en los servidores.

Mayor mano de obra.Desventajas ▫ Complejidad . aplicar las reglas de integridad a través de la red puede ser muy caro en términos de transmisión de datos.Se debe asegurar que la base de datos sea transparente.Se vuelve difícil mantener la integridad. . ▫ Economía .aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.las bases de datos distribuidas son un campo relativamente nuevo y poco común por lo cual no existe mucho personal con experiencia o conocimientos adecuados. ▫ Seguridad .El diseño de una base de datos distribuida debe considerar la fragmentación. ▫ Carencia de estándares .se debe trabajar en la seguridad de la infraestructura así como cada uno de los sistemas. El diseño de la base de datos se tiene que trabajar tomando en cuenta su naturaleza distribuida. replicación y ubicación de los fragmentos en sitios específicos. ▫ Falta de experiencia . ▫ Integridad . ▫ Diseño de la base de datos se vuelve más complejo .

. como fragmentar la información. ▫ Usuarios globales. ▫ Sin embargo. como asignar cada fragmento entre los diferentes sitios de la red.Aspectos importantes de los SMBD distribuidos • Diseño de la base de datos distribuida. ▫ En el diseño de la BDD también es importante considerar si la información está replicada. el directorio combina información local con información global. se debe manejar un solo directorio global. ▫ Considerar el problema de como distribuir la información entre diferentes sitios. ▫ Primero. si existen también usuarios locales. ▫ Manejo del directorio. ▫ Segundo. como mantener la consistencia de la información.

▫ Problema de optimización es NP-difícil. ▫ No obstante. ▫ El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos.Aspectos importantes de los SMBD distribuidos • Procesamiento de consultas. por lo que en tiempos razonables solo se pueden obtener soluciones aproximadas. ▫ En BDD se tiene que considerar el procesamiento local de una consulta junto con el costo de transmisión de información al lugar en donde se solicitó la consulta. el orden en que se realizan las transacciones afecta grandemente la velocidad de respuesta del sistema. .

▫ Los algoritmos más utilizados son variaciones de aquellos usados en sistemas centralizados: candados de dos fases. . ordenamiento por estampas de tiempo múltiples y control de concurrencia optimista. ▫ Coordinar accesos concurrentes a la base de datos. ▫ Para los usuarios puedan accezar la base de datos en una forma multiprogramada mientras se preserva la ilusión de que cada usuario está utilizándola solo en un sistema dedicado. ▫ Asegura que transacciones múltiples sometidas por usuarios diferentes no interfieran unas con otras de forma que se produzcan resultados incorrectos. El sistema no debe permitir que dos o más transacciones se bloqueen entre ellas. ordenamiento por estampas de tiempo. ▫ Manejo de interbloqueos.Aspectos importantes de los SMBD distribuidos • Control de concurrencia.

Así. se debe ofrecer garantías de que la información es confiable.• Confiabilidad. centralizado o distribuido. • En cualquier sistema de bases de datos. las cuales tienen un inicio y fin. ya que una sola transacción puede involucrar dos o más sitios de la red. Así cada consulta o actualización de la información se realiza mediante transacciones. el control de recuperación en sistemas distribuidos debe asegurar que el conjunto de agentes que participan en una transacción realicen todos un compromiso (commit) al unísono o todos al mismo tiempo restablezcan la información anterior (roll-back). En sistemas distribuidos. el manejo de la atomicidad y durabilidad de las transacciones es aún más complejo. .

.

FRAGMENTACIÓN • RAZONES PARA FRAGMENTAR ▫ Encontrar unidad de distribución más adecuada. ▫ Disminuir cantidad de accesos remotos. • DESVENTAJAS ▫ Degradación del rendimiento. ▫ Incrementar el nivel de concurrencia. ▫ Complejidad de mantenimiento de la integridad ▫ referencial. .

Rn. … Rn y el dato di esta en Rj. R = Ri. "RiÎ FR Frag horizontal : R1. tal que. R2…. entonces debe existrir algun oprador relacional Ñ. ▫ Reconstrucción: Si la relacion R se descompone en los fracmentos R1.… Rn .R2.. entoces no debe estar en ningun otro fracmento rk(k1j). R2. …. el dato di sólo en • Rj • Frag vertical: sólo se repiten atributos clave está en Rj y .R2.FRAGMENTACIÓN • CORRECCIÓN EN LA FRAGMENTACIÓN " di Î a algún Rj ▫ Completitud: La descomposición de una relación R en los fragmentos R1. ▫ Disjunción: Si la relacion R se descompone en los fracmentos R1.

Mezcla de fragmentación vertical y horizontal. Operador SELECCIÓN: s Ci (R) Primaria y Derivada Recuperación mediante UNION. Recuperación mediante JOIN. Operación PROYECCIÓN: P Li (R) Agrupamiento y División.TIPOS DE FRAGMENTACIÓN • HORIZONTAL           Divide la relación en subconjuntos de tuplas. Recuperación mediante UNION y JOIN. • VERTICAL • HÍBRIDA . Divide la relación verticalmente en columnas.