Está en la página 1de 2

En muchas aplicaciones actuales, los datos son distribuidos.

Lo cual abre
el debate de cmo y cundo procesarlos.
No distingue entre ancho de banda y latencia. Pues la latencia es inherente
en los ambientes distribuidos, y estos son fsicamente limitados con la
velocidad que podemos enviar datos a travs de una red.
El paralelismo inter-query resulta de la habilidad de ejecutar mltiples
queries al mismo tiempo.
El paralelismo intra-query se logra por rupturas a un query en subqueries.
Donde cada uno es ejecutado en un sitio diferente, entrando a una parte
diferente de la base de datos distribuida.
Uno de los aspectos de la ms fcil expansin del sistema es el econmico.
Normalmente es mucho menos costoso instalar a travs de un sistema de
computadoras pequeas con el poder equivalente a una mquina grande.
Algunas complicaciones son:
Los datos pueden ser duplicados en ambientes distribuidos. Una base de
datos distribuida puede ser diseada para que la base de datos completa, o
parte de ella, se encuentre en diferentes sitios de una red. Esto no es esencial
que todos los sitios en la red contengan la base de datos; esto solo es esencial
que ms de uno de los sitios donde reside la base de datos.

Algunos sitios fallan o algunos enlaces fallan mientras una actualizacin


est siendo ejecutada. El sistema debe hacer seguros los efectos que sern
reflejados en los datos que residen en los sitios que estn fallando o
inalcanzables tan pronto como el sistema puede recuperarse de la falla.

Algn sitio puede no tener informacin instantnea cuando est siendo


mostrada en otros sitios. La sincronizacin de transacciones en mltiples
sitios es considerablemente difcil para un sistema centralizado.
Hay dos alternativas bsicas para particionar los datos y son replicated y
non-replicated. En el esquema de particiones la base de datos se divide en un
nmero de particiones separadas cada uno de los cuales se coloca en un sitio
diferente.
El diseo replicated tambin puede ser fully replicated (cuando la base de
datos completa es almacenada en cada sitio) o partially replicated (donde
cada particin de la base de datos es almacenada en ms de un sitio, pero no
en todos los sitios).

Los 2 conflictos fundamentales de diseo son fragmentacin, la


separacin de la base de datos en particiones llamadas fragmentos y
distribucin, la ptima distribucin de los fragmentos.
Un directorio contiene informacin (como son descripciones y ubicaciones)
acerca de secciones de datos en la base de datos. Puede ser un directorio
global para el DDBS entero o local en cada sitio; puede ser centralizada en un
sitio o distribuido en varios sitios; puede haber una sola copia o mltiples
copias.

Para procesar un query se disean algoritmos que analicen y conviertan


en una serie de operaciones de manipulacin de datos. El problema es
decidir una estrategia para ejecutar cada query. Para la ejecucin de cada
consulta sobre la red de la manera ms rentable. Los factores a considerar son
la distribucin de datos, costos de comunicacin y la falta de datos suficientes
disponibles localmente. El objetivo es optimizar donde el paralelismo inherente
se utiliza para mejorar el rendimiento de la ejecucin de la transaccin, sujeta a
las limitaciones.

El control de concurrencia involucra la sincronizacin de acceso a las


bases de datos distribuidas, como mantener la integridad de la base de
datos. Es, sin duda alguna, uno de los problemas ms ampliamente estudiados
en el campo DDBS. El problema del control de concurrencia en un contexto
distribuido es un poco diferente que en un marco centralizado. Uno no slo
tiene que preocuparse sobre la integridad de una nica base de datos, sino
tambin sobre la consistencia de mltiples copias de la base de datos.

Las soluciones alterativas son numerosas. Las dos clases generales son
pessimistic sincronizacin de la ejecucin de las peticiones del usuario antes
de empezar la ejecucin y optimistic, ejecutar las solicitudes y luego
comprobar si la ejecucin ha comprometido la consistencia de la base de
datos.

Las bases de datos al igual que los sistemas operativos es la


competencia por acceso a los recursos. Puede resultar en un callejn sin
salida si el mecanismo de sincronizacin se basa en la fijacin. Las
alternativas ms conocidas son prevencin, mantener activo y
deteccin/recuperacin.

También podría gustarte