Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos
lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos y geográficos (por ejemplo. un servidor corriendo 2 máquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamientos autónomos, estos permiten realizar operaciones locales o distribuidas. Un Sistema de Bases de Datos Distribuida (SBDD), en inglés Distributed Database Management System (DDBMS), es un sistema en el cual múltiples sitios de bases de datos están ligados entre sí por un sistema de comunicaciones, de tal forma que un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local. Un sistema distribuido de bases de datos se almacena en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes: Hay múltiples computadores, llamados sitios o nodos. Estos nodos deben de estar comunicados por medio de algún tipo de red de comunicaciones para transmitir datos y órdenes entre los sitios. Evolución Hay varios factores que han hecho que las bases de datos evolucionen a bases de datos distribuidas. En el mundo de los negocios se ha dado una globalización y a la vez las operaciones de las empresas son cada vez más descentralizadas geográficamente. También el poder de las computadoras personales aumentó y el costo de los mainframes ya no tenía sentido. Además la necesidad de compartir datos ha hecho que crezca el mercado de las bases de datos distribuidas. Ventajas Refleja una estructura organizacional - los fragmentos de la base de datos se ubican en los departamentos a los que tienen relación. Autonomía local - un departamento puede controlar los datos que le pertenecen. Disponibilidad - un fallo en una parte del sistema solo afectará a un fragmento, en lugar de a toda la base de datos. Rendimiento - los datos generalmente se ubican cerca del sitio con mayor demanda, también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores. Economía - es más barato crear una red de muchas computadoras pequeñas, que tener una sola computadora muy poderosa. Modularidad - se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos). Desarrollo modular. Si el sistema necesita ser ampliado con nuevas localizaciones o nuevas unidades, en sistemas de base de datos centralizados, esta acción requiere sustanciales esfuerzos adicionales, así como la interrupción del servicio. Sin embargo, en las bases de datos distribuidas, el trabajo simplemente requiere agregar nuevos ordenadores y datos en los nuevos sitios y finalmente conectarlos al sistema distribuido, sin que exista ninguna interrupción de funciones. Mejor tiempo de respuesta. Si los datos están distribuidos de una manera eficiente, las peticiones de los usuarios van a poder ser satisfechas directamente desde los datos locales, por lo que se proporciona una respuesta más rápida. Por otro lado, en sistemas centralizados, todas las solicitudes tienen que pasar a través del ordenador central, lo cual incrementa el tiempo de respuesta. Más fiable. En caso de fallo en la base de datos, el todo el sistema de base de datos centralizada se detiene. Sin embargo, en sistemas distribuidos, cuando un componente falla, el funcionamiento del sistema continua, aunque pueda tener una reducción de rendimiento. Por lo tanto, una base de datos distribuida es más fiable. Menor coste de comunicación. En sistemas de bases de datos distribuidas, si el dato se localiza allí dónde es más usado, el coste de comunicación para manipulación de datos puede ser minimizado. Esto no es factible en sistemas centralizados. ¿POR QUÉ PUEDES NECESITAR UNA BASE DE DATOS DISTRIBUIDA? Naturaleza distribuida de unidades organizacionales. Muchas organizaciones actuales se dividen en varias unidades que se distribuyen físicamente por el mundo. Cada unidad requiere su propio conjunto de datos local. Así, la base datos global de la organización se convierte en una base de datos distribuida. Necesidad de intercambio de datos. Cuando hay múltiples unidades organizativas, a menudo necesitarán comunicarse entre sí y compartir sus datos y recursos. Esto requiere bases de datos comunes o bases de datos replicadas que deberían ser utilizadas mediante sincronización. Soporte para procesamiento de transacciones online (OLTP) y procesamiento de analítica online (OLAP). OLTP y OLAP funcionan con sistemas diversificados que pueden tener datos comunes. Los sistemas de bases de datos distribuidas ayudan a ambos procesos proporcionando datos sincronizados. Recuperación de base de datos. Una de las técnicas comunes utilizadas en un sistema de gestión de base de datos distribuida es la replicación de datos a través de los diferentes sitios. Esta replicación de datos, automáticamente ayuda a la recuperación de datos si una base de datos fuera dañada en algún sitio. Los usuarios podrían acceder a los datos desde otros sitios mientras que la base de datos dañada se reconstruye. Por lo tanto, un fallo en la base de datos puede llegar a ser casi imperceptible por los usuarios. Soporte para múltiple aplicaciones. La mayoría de organizaciones utilizan una gran variedad de aplicaciones de software, cada una con su base de datos específica. Un sistema de gestión de base de datos distribuida proporciona una funcionalidad uniforme al utilizar los mismos datos entre las diferentes plataformas.
las bases de datos distribuidas tiene su sistema de la siguiente manera:
Las 12 reglas fundamentales de las Bases de Datos Distribuidas
1. Autonomía local 2. No dependencia de un sitio local 3. Operación continua 4. Independencia con respecto a la localización 5. Independencia con respecto a la fragmentación 6. Independencia de replica 7. Procesamiento distribuido de consultas 8. Manejo distribuido de transacciones 9. Independencia con respecto al equipo 10. Independencia con respecto al sistema operativo 11. Independencia con respecto a la red 12. Independencia con respecto a la DBMS