Está en la página 1de 9

BASES DE DATOS DISTRIBUIDAS

Las empresas son el centro de atencin de la economa, por lo que la manera de administrarlas as como su estructura es
importante. Dentro de una empresa tambin es importante la manipulacin de los datos, ya que estos ltimos se han convertido en un
recurso valioso, porque a partir de ellos se obtiene informacin la cual es importante para la toma de decisiones, por lo tanto, la
manera de almacenar los datos as como el buen manejo de los mismos son esenciales dentro de una empresa.
Actualmente, la mayora de las empresas almacenan los datos de manera electrnica en bases de datos; una forma como los
datos se encuentran situados es que todos se concentran en un nico equipo de cmputo, es decir, en un slo sitio; en este caso, se
requiere que el equipo donde se ubique la base de datos cuente con las capacidades suficientes para albergar el volumen de datos.
La forma de almacenamiento mencionada en el prrafo anterior se conoce como base de datos centralizada, esta tiene
ventajas, tales como: un buen control de los datos ya que residen en un solo sitio lo que permite al administrador tener una
organizacin adecuada que conduce a tener mayor seguridad porque el control de los datos se realiza por una sola persona; mnima
redundancia, resultado de haber hecho un buen estudio de los datos que son necesarios para la empresa.
Una base de datos centralizada tambin tiene desventajas, por mencionar algunas son una baja disponibilidad, ya que una
base de datos centralizada queda inaccesible para los usuarios cuando se presenta un fallo en el sitio porque todos los datos estn en
slo lugar; adems, si no se prev el aumento de la base de datos en el diseo, puede ocasionar posteriormente que el equipo donde
se aloje se sobrecargue, es decir, que se exceda la capacidad de almacenamiento y esto puede originar que el procesamiento de los
datos se vuelva lento; tambin, cuando se requieran hacer cambios a la base de datos se tiene que inhabilitar por un momento, y esto
provoca que los usuarios no puedan tener acceso a los datos mientras se realiza el cambio, porque no existen copias que se puedan
utilizar mientras no se encuentra disponible la base de datos.
Con el avance de la tecnologa se han desarrollado equipos de cmputo con grandes capacidades y a precios accesibles,
esto es aprovechado por las empresas porque as las reas con las que cuenta pueden tener sus propios equipos de cmputo y de
esta manera trabajar con los datos correspondientes a la misma.
Las redes de computadoras son otro avance en la tecnologa que ha ido evolucionando y que ha favorecido tanto en lo
personal como en las oficinas ya que permite tener conectados varios equipos de cmputo y de esta manera se pueden compartir
datos y otros recursos como por ejemplo, las impresoras.
Con el desarrollo de equipos de cmputo, el uso de bases de datos y las redes de computadoras ha sido posible el
surgimiento de las bases de datos distribuidas, con sta, los datos se pueden almacenar en ms de un sitio, es por eso que algunos
autores (Pelagatti, 1984; Date, 2001) dicen que una BDD se adapta a la estructura descentralizada de las empresas ya que cada una
de las reas maneja sus propios datos; adems, los datos se pueden compartir entre los sitios porque una BDD est soportada por
una red de computadoras.
Dos aspectos importantes dentro de las bases de datos distribuidas son, la distribucin y la correlacin lgica, es decir, los
datos se van a encontrar alojados en los diferentes sitios de la red, pero aunque estn fsicamente separados cuentan con
propiedades que los mantiene lgicamente relacionados.
Con una BDD se tiene mayor disponibilidad de los datos porque se pueden tener copias en otros sitios, se minimiza la
sobrecarga de comunicacin porque las consultas hacia otros sitios se reducen y se disminuye la sobrecarga de un equipo de
cmputo porque los datos son repartidos entre los sitios que conforman la BDD.
Los diseadores de base de datos pueden dar la propuesta de utilizar una BDD por que tiene varias ventajas, como las
mencionadas en el prrafo anterior, por lo tanto, en algunas carreras relacionadas en computacin se imparten clases de BDD, tanto
en universidades internacionales as como en algunas de nuestro pas.

Bases de Datos Distribuidas


Una BDD se adecua a las empresas descentralizadas, por tal motivo, es fundamental orientar al lector sobre las caractersticas de la
descentralizacin, para que se pueda percibir su importancia en la estructura de una BDD.
La descentralizacin consiste en delegar autoridad a los subordinados que se encuentran en unidades autnomas dentro de
una empresa, las unidades pueden ser un rea, departamento o sucursal ubicados por diversos lugares, dentro de la misma ciudad,
en una diferente, incluso en otro pas. Las organizaciones descentralizadas tienen pocos flujos de informacin e interacciones entre
las divisiones y las oficinas principales, y entre las divisiones.
En otras palabras, el trmino descentralizacin se refiere a la manera en cmo es dirigida una empresa, en donde los
directivos ceden parte de su autoridad para la toma de decisiones a los directivos en niveles inferiores, ya que son los ms indicados
para actuar rpidamente ante las circunstancias que se presenten en su entorno, por estar ms cerca a ese punto conocen ms
detalladamente los problemas y pueden resolverlos de la mejor manera que un alto directivo. Entre ms se delega la autoridad dentro
de la empresa est ms descentralizada.
La descentralizacin ha cobrado importancia porque las empresas ya no estn limitadas por las fronteras de las naciones,
varias empresas se han extendido a diversos pases como la empresa estadounidense McDonalds que vende hamburguesas en
China o la empresa alemana BMW que arma coches en Carolina del Sur.
En empresas descentralizadas se debe considerar el ambiente en el que se encuentra inmersa cada sucursal ya que no son
iguales, por ejemplo, los gustos del cliente son diferentes en cada zona, cambian constantemente porque dejan de estar satisfechos
por los productos o servicios que se le ofrecen. Todas las organizaciones tienen competidores, algunas ms que otras, pero lo
importante es que no deben ser ignorados; estos son slo algunos ejemplos en los que se observa que los ambientes son diferentes y
los directivos deben adaptar sus funciones a los nuevos intereses de la sociedad en la que se mueven, deben familiarizarse con los
valores y la cultura de otras naciones, y actuar de manera que acepten y se adhieran a esos aspectos socioculturales. Por todo esto,
es conveniente descentralizar la toma de decisiones hacia los directivos inferiores. Adems, debido a la dimensin de las empresas un
solo administrador no puede realizar todo el trabajo de la empresa ya que no puede supervisar directamente todas las actividades, por
tanto tiene que delegar. La descentralizacin posee algunas ventajas, se listan a continuacin:

Los altos directivos estn ms cerca del punto donde deben tomarse las decisiones. Las personas que viven
los problemas son las ms indicadas para resolverlos localmente, economizando tiempo y dinero.

Permite aumentar la eficiencia, aprovechando mejor el tiempo y la aptitud de los administradores.

Permite mejorar la calidad de las decisiones a medida que su volumen y complejidad se reducen, aliviando a
los jefes del exceso de trabajo de toma de decisiones.

Se gana tiempo, ya que se toman rpidamente decisiones que tardaran varios das en ser comunicadas.

Los gastos de coordinacin pueden ser reducidos debido a la mayor autonoma para tomar decisiones.

Permite la formacin de administradores locales o regionales ms motivados y ms conscientes de sus


resultados operacionales que el administrador corriente.

El grado de descentralizacin es diferente para cada empresa, la descentralizacin absoluta no es recomendable porque
siempre deber existir una unidad de gestin centralizada que coordine todas y cada una de las acciones, es decir, aunque se haya
delegado la autoridad, el directivo de nivel superior toma las decisiones ms importantes que encaminan hacia la visin de la
empresa. Adems, si se diera la descentralizacin total las funciones de los altos directivos se eliminaran as como tambin sus
puestos, consecuentemente la empresa desaparecera porque cada quien actuara de forma independiente sin objetivos globales.
Utilidad de las BDD en empresas descentralizadas
En una empresa descentralizada, cada una de las reas tiene los datos necesarios para realizar las funciones que le corresponden,
por lo tanto, son quienes tienen el control local de los mismos. En este punto es donde se puede observar la utilidad de la BDD, ya
2

que los datos en una empresa de este tipo se encuentran distribuidos, esta dispersin se refleja en mayor medida en aquellas
empresas con distribucin geogrfica es decir, que cuenten con sucursales en varias ciudades o pases.
Conforme cambia el entorno de los negocios, reaccionan las metas y las estructuras organizacionales, la base de datos de la
que depende la empresa tambin cambia para seguir siendo efectiva, es decir, debido a los cambios que se puedan presentar en la
empresa, la manipulacin de los datos puede verse afectada y por consiguiente tambin la base de datos, puesto que estas deben
cubrir las necesidades de informacin de la empresa.
Cada una de las reas de una empresa descentralizada cumple con sus funciones para la satisfaccin de sus clientes, estos
realizan sus operaciones localmente pero existen algunas ocasiones en donde van a necesitar realizar esas operaciones en un rea
distinta, y las BDD pueden cubrir esta necesidad, cada una de las instalaciones es capaz de procesar de forma independiente las
solicitudes de los usuarios que requieran acceso a los datos locales (es decir, cada instalacin tiene un cierto grado de autonoma
local) y tambin es capaz de procesar datos almacenados en otras computadoras de la red.
Mientras la BDD refleje ms a las empresas, tendr mayor aceptacin, porque los administradores utilizan la tecnologa para
ejecutar sus operaciones y realizar sus tareas de una mejor manera y ms cmoda y por tanto busca aquella que le satisfaga sus
necesidades y le permita alcanzar sus objetivos.
Adems, desde un aspecto diferente al de la organizacin segn Pelagatti, las razones econmicas de una empresa tambin
son importantes para implementar una BDD porque los costos de las computadoras han disminuido y resulta ms econmico conectar
varias computadoras pequeas con capacidad similar a una de gran tamao, esto hace que en trminos econmicos las reas de una
empresa adquieran computadoras independientes.

Razones para implementar bases de datos distribuidas


Ya se observ la adaptabilidad de una BDD en las empresas descentralizadas pero tambin es bueno conocer otras razones por las
que es apropiado el uso de esta tecnologa, Pelagatti desde su perspectiva observa un conjunto de razones que se deben analizar
para decidir la conveniencia de disear una BDD, las cuales se describen a continuacin:
a)
b)
c)
d)
e)
f)

Razones econmicas y de organizacin


Interconexin de base de datos existentes
Crecimiento incremental
Reduccin de sobrecarga de comunicacin
Consideraciones de desempeo
Confiabilidad y disponibilidad

a) Razones econmicas y de organizacin


A medida que la empresa crece tiende a descentralizarse, por esta razn este aspecto como una razn para desarrollar una
base de datos distribuida. Esta tecnologa se adapta a la estructura descentralizada porque la distribucin de datos a travs
de las distintas reas de una organizacin permite que estos datos residan donde han sido generados o donde son ms
necesarios, pero pueden continuar siendo accesibles desde otras reas diferentes.
En una BDD la descentralizacin se aplica cuando un administrador global, quien es responsable de toda la base de
datos, delega parte de sus funciones a los administradores locales, de esta manera, se tiene mejor control sobre los datos en
cada sitio porque slo disponen de una parte de la base de datos.
b) Interconexin de base de datos existentes
En una empresa en la que existen varias bases de datos, localizadas en distintas reas de la misma, se puede presentar la
necesidad de realizar aplicaciones globales, es decir, un usuario de una determinada rea puede requerir de datos ubicados
en una distinta, en este caso es imprescindible poder tener acceso a los datos de las diferentes reas. Con este situacin se
3

observa la conveniencia de implantar una base de datos distribuida, porque existe la necesidad de comunicacin entre las
diferentes reas.
Cuando se comienza a disear una BDD a partir de las ya existentes, los especialistas en este campo tienen que
crear un solo esquema que involucre a los esquemas de las bases de datos locales, este enfoque de diseo es el buttom-up,
de esta manera, la empresa slo contar con un esquema de BD, pero los datos podrn ser compartidos entre las diferentes
reas. Un aspecto importante al aplicar esta alternativa es que cuando se analiza la totalidad de los esquemas se pueden
encontrar datos repetidos que se pueden eliminar y obtener una base de datos consistente.
c) Crecimiento incremental
Si la visin de una empresa es crecer, una BDD es la adecuada para cumplir con estos objetivos. Generalmente mientras una
empresa alcanza el xito esperado esta tiende al crecimiento, puede ser en trminos de tamao o de recursos, de la expansin de
sus mercados o del volumen de sus operaciones; como resultado de la ampliacin de la empresa es el surgimiento de nuevos datos
los cuales sern necesarios aadir a la base de datos para que esta siga siendo efectiva, este proceso se podr realizar con un
mnimo grado de impacto sobre los sitios ya existentes. En conclusin, los crecimientos de las empresas y por consiguiente tambin
el de los datos no son un dificultad para la BDD cuando se requiere adherirlos a la base de datos puesto que la agregacin de estos
afecta mnimamente sobre los sitios ya presentes.
d) Reduccin de sobrecarga de comunicacin
Cuando se utiliza una BDD la sobrecarga de comunicacin se minimiza, ya que generalmente los datos se mantienen en los sitios en
donde son ms necesarios, de esta manera se incrementan las aplicaciones locales y por lo tanto, el uso de los enlaces de
comunicacin se reduce aunque habr ocasiones en la que se requiera de aplicaciones globales, sin embargo, el trfico en la red ser
menor. Por esta razn, uno de los objetivos primordiales de BDD es maximizar las aplicaciones locales.
e) Consideraciones de desempeo
Existen algunos aspectos que permiten mejorar el desempeo de la base de datos, uno de estos es la distribucin de los datos ya que
se pueden tener cerca del sitio donde tienen mayor uso, esta cercana conlleva a que la recuperacin de los datos sea ms rpida,
sino fuera as, entre ms distantes estn los sitios es mayor el tiempo de respuesta ya que influye el retardo de los enlaces de
comunicacin. Adems, se reduce el trfico en la red de comunicacin evitando los cuellos de botella, porque el sistema acceder en
pocas ocasiones a los datos de otros sitios.
Otro de los aspectos que mejoran el desempeo es que los datos se reparten entre los diferentes sitios de la red, estos
contienen slo una parte de la base de datos, por lo tanto, la cantidad de datos que se almacena en cada sitio es menor con respecto
a la base de datos total,en otras palabras, se divide la carga de trabajo, de este modo, la distribucin de los datos conlleva a que el
procesamiento de estos se realice con mayor velocidad.
f) Confiabilidad y disponibilidad
Cuando se quiere acceder a los datos en cualquier momento y adems, tener la seguridad de que los datos sean correctos, son
motivos para usar BDD. La disponibilidad se da cuando se puede acceder a los datos a cualquier hora y en cualquier lugar, es decir,
los datos debern estar siempre disponibles para ser consultados, no importando en qu momento se realicen ni de los fallos que se
puedan presentar. Las rplicas (copias de los datos) en los diferentes sitios de la red aumentan la disponibilidad.
En una base de datos distribuida se pueden presentar fallos frecuentemente, a pesar de esto, la disponibilidad de los datos
es mayor porque regularmente slo afectan al sitio donde se origin, y la base de datos completa no se ver afectada. Las rplicas
permiten que las aplicaciones continen con su ejecucin cuando se presenta un fallo en el sitio donde se est realizando la
aplicacin, el sistema localiza una copia en otro sitio para acceder a los datos requeridos por la aplicacin y as esta pueda continuar.
La confiabilidad se refiere al hecho de que los datos estn consistentes, a pesar de cualquier desastre que se presente en el
sitio; cuando se modifica un fragmento en un sitio se deben actualizar todas las rplicas que se tengan de este, adems, cuando se

efecta una transaccin esta debe concluir completamente y si no es as, se debe deshacer cualquier cambio hecho a la base de
datos para que quede como estaba antes de iniciar la transaccin.
Algunas de las razones que fueron descritas tienen relacin entre s, ya que a partir de una se da por consiguiente otra de
ellas, por ejemplo, la descentralizacin se presenta a medida que las empresas crecen, en este caso se est presentando un
crecimiento incremental, en el diseo de BDD se consideran los crecimientos futuros ya que se pueden aadir sitios en cualquier
instante sin afectar el funcionamiento de los sitios ya existentes. Tambin se puede dar el caso que la empresa descentralizada ya
cuente con bases de datos y que requiera la integracin de estas, por tanto una BDD es conveniente porque los datos se pueden
mantener en donde se requiera un mayor uso y esto reduce la sobrecarga de comunicacin asimismo mejora el rendimiento de la
base de datos.

Definicin de Bases de datos distribuidas


Las BDD ofrecen una manera diferente de almacenar los datos en comparacin con la ms comn, la centralizada. Para conocer esta
tecnologa se comienza con la definicin de la misma, diversos autores tienen su propio punto de vista para describirlas, pero en todas
se utilizan trminos semejantes que se orientan hacia la misma idea. A continuacin se presentarn dos de ellas:
Elmasri/Navathe define una base de datos distribuida como una coleccin de datos que pertenece lgicamente al mismo
sistema pero que est dispersa fsicamente entre los sitios de una red. Para Pelagatti, una base de datos distribuida es una
coleccin de datos relacionados lgicamente, pero dispersos sobre diferentes sitios de una red de computadoras.
En base a las definiciones anteriores, se concluye que en una BDD los datos estn alojados fsicamente en ms de un sitio,
sin embargo, lgicamente todos estn relacionados y constituyen la base de datos, esta tecnologa est soportada por una red de
comunicacin, lo que permite que los sitios puedan intercambiar datos entre s. Conforme a las definiciones tratadas, se distinguen
dos caractersticas importantes para una BDD: la distribucin y correlacin lgica.

Distribucin: esta caracterstica corresponde al hecho de tener a los datos almacenados en ms de un sitio.

Correlacin lgica: se refiere a que los datos que estn ubicados en los diferentes sitios poseen algunas propiedades
que los mantiene lgicamente relacionados; si no tuvieran una propiedad en comn sera como si cada sitio tuviera su
propia base de datos.

Clasificacin de las BDD


El trmino sitio denota a un equipo de cmputo que forma parte de la red de comunicacin el cual tiene la capacidad de
almacenar y procesar los datos. Pueden variar en su tamao y funcin, por lo tanto puede ser desde una PC hasta un mainframe. La
ubicacin de estos puede ser dentro del mismo edificio, en edificios adyacentes o geogrficamente distantes, es decir, en una ciudad
diferente o hasta en otro pas.
Cada uno de los sitios tiene la capacidad de procesar y administrar sus datos localmente, por lo que para la manipulacin de
los mismos, los sitios pueden utilizar el mismo SMBD o pueden ser totalmente diferentes, con base en esto, se clasifica a las bases de
datos como homogneas y heterogneas.

Bases de datos distribuidas homogneas. En este tipo de base de datos, segn Silberschatz, todos los sitios tienen
sistemas manejadores de bases de datos idnticos, estn conscientes de la existencia de los dems sitios y acuerdan
cooperar en el procesamiento de las solicitudes de los usuarios.
En base a la definicin anterior, la homogeneidad se da cuando todos los sitios utilizan el mismo SMBD, entre estos pueden
intercambiar datos en el momento que lo requieran, por ejemplo, cuando en un sitio se presente un problema que imposibilite
tener acceso a los datos locales, el SMBD debe buscar una copia de los datos en otro sitio para que los usuarios continen
con sus aplicaciones, por tal motivo el autor menciona que estn conscientes de la existencia de otros sitios.

Base de datos distribuida heterogneas. De acuerdo con Silberschatz, en este tipo de base de datos sitios diferentes
puede que utilicen esquemas diferentes y diferente software de gestin de sistemas de bases de datos. Es decir, una BDD
es heterognea cuando se ha formado a partir de bases de datos ya existentes, y por lo tanto cada uno de los sitios difiere en
la utilizacin del SMBD para la manipulacin de los datos.

Diseo de bases de datos distribuidas


Una vez que ya se han analizado las razones y se decide la conveniencia de implementar una BDD se comienza con la etapa de
diseo. Esta fase consiste en modelar cmo la base de datos estar estructurada de manera lgica, independientemente de su
almacenamiento fsico. Para tener un buen diseo de BDD primero se debe conocer cul es el objetivo de la distribucin de datos,
para que se responda eficientemente a las solicitudes de los usuarios.
En el diseo de una BDD se pueden utilizar dos mtodos, el bottom-up y top-down; estos difieren en la manera en cmo se
comienza a disear una BDD, el cual depender del entorno de la empresa que se analiza. El mtodo top-down es el ms comn,
este comienza el diseo desde cero, a partir de la identificacin de los requerimientos de la empresa y todo el proceso necesario hasta
obtener un esquema global, este ltimo es la entrada para el diseo de distribucin que consiste en la fragmentacin de la base de
datos y cuando ya se tienen los fragmentos se deben tomar las decisiones para ubicarlos en los sitios. El ltimo paso es el diseo
fsico, en donde se analizan los dispositivos de almacenamiento disponibles en cada sitio, para guardar ah los datos.
El mtodo Bottom-up se utiliza cuando en una empresa ya existen varias bases de datos y las cuales requieren ser
integradas. Por tanto, la obtencin del esquema global se realiza mediante la integracin de los esquemas de las bases de datos
locales. Para llegar a este punto, se debe convertir cada modelo de base de datos local a uno en comn para todos. Una vez que se
tiene el esquema global, el proceso que se sigue para el diseo de la BDD es el mismo que se realiza para el mtodo top-down.
Otra tarea de diseo de BDD y que los especialistas no deben descuidar es que debern enfocarse en conocer la existencia
de equipos de cmputo, detallando sus caractersticas y ubicacin en caso de haberlos, si no los hubiera se deber entonces
recomendar el equipo y software necesarios para realizar la tarea.
Desde el enfoque de las BDD el primer paso corresponde al diseo del esquema global y el segundo, corresponde al diseo
fsico para cada uno de los sitios. Especficamente, en el diseo de BDD se debe determinar cmo los datos van a ser localizados a
travs de los sitios de la red, por lo tanto surgen dos diseos: el diseo de fragmentacin y el de distribucin de los datos.

Objetivos de diseo
Cuando se ha decidido implementar una BDD en una empresa, es importante conocer cul ha sido el objetivo para su creacin, ya
que dependiendo de esto es como se realizar la distribucin de los datos. Un problema en el diseo de bases de datos distribuidas
es tomar las decisiones para ubicar los datos en los sitios y tambin decidir qu copias se realizarn y en dnde se alojarn. Desde el
punto de vista del autor, es necesario conocer cul es el objetivo que se busca al distribuir los datos para de esta manera dar solucin
al problema de la distribucin de los mismos. Pelagatti propone cuatro objetivos:
a) Procesamiento local
b) Disponibilidad y confiabilidad de los datos distribuidos
c) Distribucin de carga de trabajo
d) Costos de almacenamiento y disponibilidad

a) Procesamiento local
6

Este objetivo es el ms comn, ya que los datos se reparten hacia los sitios que ms los utilizan, de esta manera aumentan las
aplicaciones locales y disminuyen las interacciones entre los sitios, realizndose estas ltimas slo en caso necesario. Cuando se
habla de aplicaciones locales no es en el hecho de que se ejecuten en una misma ubicacin fsica, sino que para la ejecucin de una
aplicacin, una computadora accede a su propia porcin de datos, es decir, donde se procese la ejecucin de la aplicacin es donde
debern estar almacenados los datos para acceder a estos, en el caso de que no fuera as la aplicacin es considerada global.
Aunque haya accesos remotos, si la computadora donde se lleva a cabo el procesamiento de datos accede a su propia porcin de
datos, estas se consideran locales.
El procesamiento local es adecuado para una empresa con estructura descentralizada, ya que cada rea cuenta con datos
propios los cuales son tiles para realizar sus funciones, al estar de esta manera los procesos que se realizan en cada una de las
reas son locales, mantenerlos de esta manera reduce el acceso a otro sitio, que es lo que se pretende con este objetivo. En algunas
organizaciones del 70 al 80 % los datos se generan en centros locales.
Los sitios pueden tener control local sobre el mantenimiento, almacenamiento y uso de datos creados y almacenados localmente,
es decir, tienen autonoma local pero esto no impide la comparticin de los datos. El procesamiento local tiene varias ventajas, como
las que se listan a continuacin:

Rapidez: se accede a los datos con ms velocidad porque residen en el sitio donde se usan con mayor frecuencia.

Fcil acceso a los datos. Porque se encuentran en el sitio donde se realiz la peticin.

Disminucin de la sobrecarga de comunicacin. El acceso a los datos de otro sitio ser menor por lo tanto el trfico en la red
se reduce evitando los cuellos de botella.

Mayor rendimiento de la red. Al ser los procesos locales, los enlaces de comunicacin se utilizarn menos y el trfico en la
red ser menor, esto es una ventaja cuando se realicen aplicaciones globales.

b) Disponibilidad y confiabilidad de los datos distribuidos


Cuando la necesidad de una empresa es tener mayor disponibilidad y confiabilidad de los datos, ste es el objetivo de diseo. La
disponibilidad se refiere al hecho de poder acceder a los datos en un momento determinado y confiabilidad que los datos sean
correctos para cualquier acceso, es decir, si por alguna razn el sistema requiere acceder a una copia esta debe estar actualizada
conforme al fragmento original, estas caractersticas fueron introducidas como razones para implementar BDD.
Los datos replicados aumentan estas caractersticas, el grado de replicacin depender de la importancia que tengan los
datos para la empresa, entre ms fundamentales sean los datos se van a requerir ms copias; la replicacin debe estar controlada
para mantener la consistencia de la base de datos.
c) Distribucin de carga de trabajo
Cuando ste es el objetivo de diseo, se deben considerar las caractersticas tcnicas de los equipos de cmputo en los que sern
almacenados cada una de los fragmentos de la bases de datos, porque dependiendo de sus capacidades ser como se distribuirn
los datos, para no sobrecargar un equipo y de esta manera evitar procesamiento lentos.
Con este objetivo de diseo se disminuye la sobrecarga de trabajo de un sitio, repartindola hacia aquellas donde se
considere que tiene una carga ligera, en el aspecto econmico tambin se tienen ventajas porque se reutilizan los equipos de cmputo
con los que ya cuentan los sitios aprovechando sus capacidades, por lo que se disminuye la necesidad de adquirir equipos nuevos, en
caso que se requiera, los costos en equipo de cmputo han reducido.
d) Costos y disponibilidad de almacenamiento
Este objetivo es adecuado cuando las empresas quieren tener costos bajos en el almacenamiento de los datos, para este objetivo se
deben de considerar los aspectos tcnicos de los equipos de cmputo. La manera en cmo se distribuyen los datos tambin as como
la replicacin de los mismos repercute en los costos y disponibilidad de almacenamiento, porque supongamos que se quiere colocar
un fragmento en un determinado sitio pero la capacidad del equipo no soporta el tamao de los datos por lo tanto esto obliga a la
7

empresa a que compre un equipo que cuente con las capacidades requeridas. El costo del equipo depender de las capacidades con
las que cuente, entre mayor capacidad se requiera el costo se ir elevando.
Con una mala asignacin de los fragmentos en los sitios se adquiere como consecuencia la necesidad de adquirir equipo de
cmputo para el almacenamiento de los datos si es que no soporta el tamao del mismo o puede ser que haya sitios en los que no se
aprovecha la capacidad del equipo de cmputo.
Actualmente, con los bajos costos de las computadoras resulta ms econmico conectar pequeas computadoras con la
potencia equivalente a una gran de gran tamao, como es el mainframe. Por lo tanto, si lo que se busca es ahorro en el
almacenamiento se deben analizar las capacidades con los que cuentan los sitios.
Estos son los cuatro objetivos que propone el autor para que sean considerados en el diseo de distribucin de datos. Es
importante aclarar que no se pueden tomar en cuenta todos los objetivos porque al cumplir uno de ellos se impide el logro de otro,
como es el caso del procesamiento local y la carga de trabajo. Si se busca el procesamiento local puede ser que por lo menos un sitio
quede sobrecargado, y si se distribuye la carga de trabajo tal vez no se tenga el procesamiento local. Por eso es importante conocer
cul es la necesidad que tiene en la empresa para poder elegir el objetivo apropiado para la distribucin de los datos.

Diseo de fragmentacin
El diseo de fragmentacin consiste en dividir la base de datos en porciones ms pequeas, que forman los fragmentos. Para poder
realizar este proceso de manera eficiente se deben realizar una serie de tareas, de acuerdo con Pelagatti, lo primero que se tiene que
hacer es identificar las aplicaciones ms usuales o las que tienen mayor importancia para la empresa, estas deben ser detalladas para
obtener la siguiente informacin:

El sitio de origen de la aplicacin, es decir, desde que sitio comienza a ejecutarse.

La frecuencia con la que se realiza la aplicacin, es decir, cada cuanto tiempo se realiza la peticin, ya sea en horas,
das, semanas, etc., y el nmero de estas ejecuciones en un determinado tiempo.

El tipo de cada aplicacin. Las


modificaciones a la base de datos.

aplicaciones pueden ser de lectura o de actualizacin en donde se realizan

Toda la informacin que se adquiera de las aplicaciones es importante porque a travs de estas se van a identificar los
criterios sobre los que se basar el diseador para decidir cmo fragmentar la base de datos. Conforme se realice el anlisis de las
aplicaciones se van a ir detectando las relaciones globales que tienen mayor demanda as como los atributos que son ms solicitados.
Todo el estudio que se realiza a las aplicaciones permitir tambin detectar cuales relaciones globales sern fragmentadas y cules
no.
Una vez detectadas las aplicaciones y que se hayan definido los criterios que se utilizarn para fragmentar cada una de las
relaciones globales, se prosigue a realizar la fragmentacin de la base de datos, sta se puede realizar de tres maneras:
a) Vertical.- consiste en dividir los atributos de una relacin global; para esto se aplica una operacin de proyeccin.
b) Horizontal.- consiste en dividir las tuplas de una relacin global; se aplica una operacin de seleccin a la relacin global
correspondiente.
c) Mixto.- consiste en aplicar fragmentacin vertical a fragmentos horizontales o viceversa.
d) Existe una cuarta opcin, en la cual tambin se puede decidir no fragmentar una relacin global, porque tal vez sera ms
conveniente mantenerla completa.

Distribucin y replicacin
Cuando ya se tienen los fragmentos, lo que prosigue es determinar cmo los datos sern almacenados a travs de los sitios de la red, esto
corresponde al diseo de distribucin. Pero para que los datos sean ubicados adecuadamente, es necesario analizar las aplicaciones que
fueron detectadas al principio. Los detalles que pueden ser tiles para este diseo es el sitio de origen donde se ejecuta una aplicacin y su
frecuencia de uso, el anlisis se debe realizar con mayor cuidado para aquellas aplicaciones que son usados en ms de un sitio, para de
esta manera distinguir en donde son ms necesarias.
8

En el diseo de la distribucin de datos, tambin se determina si habr replicacin de los mismos o no. Cuando no hay replicacin,
slo consiste en que cada fragmento ser localizado nicamente en un sitio; en cambio si hay replicacin, algunos de los fragmentos se
encontrar en ms de un sitio de la BDD, puede haber replicacin completa en donde se replica toda la base de datos en cada sitio de la
BDD y replicacin parcial en donde los fragmentos son replicados en ms de un sitio, no en todos.
Se debe definir que fragmentos sern replicados, cuantas copias sern necesarias y en que sitios se alojarn, estas decisiones
dependern de las aplicaciones, en otras palabras, de la importancia de los datos y tambin de la necesidad de los mismos en cada uno de
los sitios. Si la mayora de las aplicaciones son de actualizacin, no sera conveniente tener demasiadas copias porque es ms complicado
la actualizacin de todas las rplicas, en este ltimo caso se debe limitar la replicacin. Por medio de las rplicas aumenta la disponibilidad
de los datos.
Con el anlisis cuidadoso que se realice a las aplicaciones se determinara la mejor manera para fragmentar y distribuir los datos,
todo esto correspondiendo con el objetivo de diseo que fue seleccionado. Para saber qu fragmentos corresponden a una relacin global
se crea un esquema de fragmentacin, pero tambin se debe conocer la ubicacin de cada uno de ellos, en este caso se crea un esquema
de localizacin. Los fragmentos que estn situados en un determinado sitio y que corresponden a una misma relacin forman la imagen
fsica de la relacin global.

También podría gustarte