Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Las empresas son el centro de atencin de la economa, por lo que la manera de administrarlas as como su estructura es
importante. Dentro de una empresa tambin es importante la manipulacin de los datos, ya que estos ltimos se han convertido en un
recurso valioso, porque a partir de ellos se obtiene informacin la cual es importante para la toma de decisiones, por lo tanto, la
manera de almacenar los datos as como el buen manejo de los mismos son esenciales dentro de una empresa.
Actualmente, la mayora de las empresas almacenan los datos de manera electrnica en bases de datos; una forma como los
datos se encuentran situados es que todos se concentran en un nico equipo de cmputo, es decir, en un slo sitio; en este caso, se
requiere que el equipo donde se ubique la base de datos cuente con las capacidades suficientes para albergar el volumen de datos.
La forma de almacenamiento mencionada en el prrafo anterior se conoce como base de datos centralizada, esta tiene
ventajas, tales como: un buen control de los datos ya que residen en un solo sitio lo que permite al administrador tener una
organizacin adecuada que conduce a tener mayor seguridad porque el control de los datos se realiza por una sola persona; mnima
redundancia, resultado de haber hecho un buen estudio de los datos que son necesarios para la empresa.
Una base de datos centralizada tambin tiene desventajas, por mencionar algunas son una baja disponibilidad, ya que una
base de datos centralizada queda inaccesible para los usuarios cuando se presenta un fallo en el sitio porque todos los datos estn en
slo lugar; adems, si no se prev el aumento de la base de datos en el diseo, puede ocasionar posteriormente que el equipo donde
se aloje se sobrecargue, es decir, que se exceda la capacidad de almacenamiento y esto puede originar que el procesamiento de los
datos se vuelva lento; tambin, cuando se requieran hacer cambios a la base de datos se tiene que inhabilitar por un momento, y esto
provoca que los usuarios no puedan tener acceso a los datos mientras se realiza el cambio, porque no existen copias que se puedan
utilizar mientras no se encuentra disponible la base de datos.
Con el avance de la tecnologa se han desarrollado equipos de cmputo con grandes capacidades y a precios accesibles,
esto es aprovechado por las empresas porque as las reas con las que cuenta pueden tener sus propios equipos de cmputo y de
esta manera trabajar con los datos correspondientes a la misma.
Las redes de computadoras son otro avance en la tecnologa que ha ido evolucionando y que ha favorecido tanto en lo
personal como en las oficinas ya que permite tener conectados varios equipos de cmputo y de esta manera se pueden compartir
datos y otros recursos como por ejemplo, las impresoras.
Con el desarrollo de equipos de cmputo, el uso de bases de datos y las redes de computadoras ha sido posible el
surgimiento de las bases de datos distribuidas, con sta, los datos se pueden almacenar en ms de un sitio, es por eso que algunos
autores (Pelagatti, 1984; Date, 2001) dicen que una BDD se adapta a la estructura descentralizada de las empresas ya que cada una
de las reas maneja sus propios datos; adems, los datos se pueden compartir entre los sitios porque una BDD est soportada por
una red de computadoras.
Dos aspectos importantes dentro de las bases de datos distribuidas son, la distribucin y la correlacin lgica, es decir, los
datos se van a encontrar alojados en los diferentes sitios de la red, pero aunque estn fsicamente separados cuentan con
propiedades que los mantiene lgicamente relacionados.
Con una BDD se tiene mayor disponibilidad de los datos porque se pueden tener copias en otros sitios, se minimiza la
sobrecarga de comunicacin porque las consultas hacia otros sitios se reducen y se disminuye la sobrecarga de un equipo de
cmputo porque los datos son repartidos entre los sitios que conforman la BDD.
Los diseadores de base de datos pueden dar la propuesta de utilizar una BDD por que tiene varias ventajas, como las
mencionadas en el prrafo anterior, por lo tanto, en algunas carreras relacionadas en computacin se imparten clases de BDD, tanto
en universidades internacionales as como en algunas de nuestro pas.
Los altos directivos estn ms cerca del punto donde deben tomarse las decisiones. Las personas que viven
los problemas son las ms indicadas para resolverlos localmente, economizando tiempo y dinero.
Permite mejorar la calidad de las decisiones a medida que su volumen y complejidad se reducen, aliviando a
los jefes del exceso de trabajo de toma de decisiones.
Se gana tiempo, ya que se toman rpidamente decisiones que tardaran varios das en ser comunicadas.
Los gastos de coordinacin pueden ser reducidos debido a la mayor autonoma para tomar decisiones.
El grado de descentralizacin es diferente para cada empresa, la descentralizacin absoluta no es recomendable porque
siempre deber existir una unidad de gestin centralizada que coordine todas y cada una de las acciones, es decir, aunque se haya
delegado la autoridad, el directivo de nivel superior toma las decisiones ms importantes que encaminan hacia la visin de la
empresa. Adems, si se diera la descentralizacin total las funciones de los altos directivos se eliminaran as como tambin sus
puestos, consecuentemente la empresa desaparecera porque cada quien actuara de forma independiente sin objetivos globales.
Utilidad de las BDD en empresas descentralizadas
En una empresa descentralizada, cada una de las reas tiene los datos necesarios para realizar las funciones que le corresponden,
por lo tanto, son quienes tienen el control local de los mismos. En este punto es donde se puede observar la utilidad de la BDD, ya
2
que los datos en una empresa de este tipo se encuentran distribuidos, esta dispersin se refleja en mayor medida en aquellas
empresas con distribucin geogrfica es decir, que cuenten con sucursales en varias ciudades o pases.
Conforme cambia el entorno de los negocios, reaccionan las metas y las estructuras organizacionales, la base de datos de la
que depende la empresa tambin cambia para seguir siendo efectiva, es decir, debido a los cambios que se puedan presentar en la
empresa, la manipulacin de los datos puede verse afectada y por consiguiente tambin la base de datos, puesto que estas deben
cubrir las necesidades de informacin de la empresa.
Cada una de las reas de una empresa descentralizada cumple con sus funciones para la satisfaccin de sus clientes, estos
realizan sus operaciones localmente pero existen algunas ocasiones en donde van a necesitar realizar esas operaciones en un rea
distinta, y las BDD pueden cubrir esta necesidad, cada una de las instalaciones es capaz de procesar de forma independiente las
solicitudes de los usuarios que requieran acceso a los datos locales (es decir, cada instalacin tiene un cierto grado de autonoma
local) y tambin es capaz de procesar datos almacenados en otras computadoras de la red.
Mientras la BDD refleje ms a las empresas, tendr mayor aceptacin, porque los administradores utilizan la tecnologa para
ejecutar sus operaciones y realizar sus tareas de una mejor manera y ms cmoda y por tanto busca aquella que le satisfaga sus
necesidades y le permita alcanzar sus objetivos.
Adems, desde un aspecto diferente al de la organizacin segn Pelagatti, las razones econmicas de una empresa tambin
son importantes para implementar una BDD porque los costos de las computadoras han disminuido y resulta ms econmico conectar
varias computadoras pequeas con capacidad similar a una de gran tamao, esto hace que en trminos econmicos las reas de una
empresa adquieran computadoras independientes.
observa la conveniencia de implantar una base de datos distribuida, porque existe la necesidad de comunicacin entre las
diferentes reas.
Cuando se comienza a disear una BDD a partir de las ya existentes, los especialistas en este campo tienen que
crear un solo esquema que involucre a los esquemas de las bases de datos locales, este enfoque de diseo es el buttom-up,
de esta manera, la empresa slo contar con un esquema de BD, pero los datos podrn ser compartidos entre las diferentes
reas. Un aspecto importante al aplicar esta alternativa es que cuando se analiza la totalidad de los esquemas se pueden
encontrar datos repetidos que se pueden eliminar y obtener una base de datos consistente.
c) Crecimiento incremental
Si la visin de una empresa es crecer, una BDD es la adecuada para cumplir con estos objetivos. Generalmente mientras una
empresa alcanza el xito esperado esta tiende al crecimiento, puede ser en trminos de tamao o de recursos, de la expansin de
sus mercados o del volumen de sus operaciones; como resultado de la ampliacin de la empresa es el surgimiento de nuevos datos
los cuales sern necesarios aadir a la base de datos para que esta siga siendo efectiva, este proceso se podr realizar con un
mnimo grado de impacto sobre los sitios ya existentes. En conclusin, los crecimientos de las empresas y por consiguiente tambin
el de los datos no son un dificultad para la BDD cuando se requiere adherirlos a la base de datos puesto que la agregacin de estos
afecta mnimamente sobre los sitios ya presentes.
d) Reduccin de sobrecarga de comunicacin
Cuando se utiliza una BDD la sobrecarga de comunicacin se minimiza, ya que generalmente los datos se mantienen en los sitios en
donde son ms necesarios, de esta manera se incrementan las aplicaciones locales y por lo tanto, el uso de los enlaces de
comunicacin se reduce aunque habr ocasiones en la que se requiera de aplicaciones globales, sin embargo, el trfico en la red ser
menor. Por esta razn, uno de los objetivos primordiales de BDD es maximizar las aplicaciones locales.
e) Consideraciones de desempeo
Existen algunos aspectos que permiten mejorar el desempeo de la base de datos, uno de estos es la distribucin de los datos ya que
se pueden tener cerca del sitio donde tienen mayor uso, esta cercana conlleva a que la recuperacin de los datos sea ms rpida,
sino fuera as, entre ms distantes estn los sitios es mayor el tiempo de respuesta ya que influye el retardo de los enlaces de
comunicacin. Adems, se reduce el trfico en la red de comunicacin evitando los cuellos de botella, porque el sistema acceder en
pocas ocasiones a los datos de otros sitios.
Otro de los aspectos que mejoran el desempeo es que los datos se reparten entre los diferentes sitios de la red, estos
contienen slo una parte de la base de datos, por lo tanto, la cantidad de datos que se almacena en cada sitio es menor con respecto
a la base de datos total,en otras palabras, se divide la carga de trabajo, de este modo, la distribucin de los datos conlleva a que el
procesamiento de estos se realice con mayor velocidad.
f) Confiabilidad y disponibilidad
Cuando se quiere acceder a los datos en cualquier momento y adems, tener la seguridad de que los datos sean correctos, son
motivos para usar BDD. La disponibilidad se da cuando se puede acceder a los datos a cualquier hora y en cualquier lugar, es decir,
los datos debern estar siempre disponibles para ser consultados, no importando en qu momento se realicen ni de los fallos que se
puedan presentar. Las rplicas (copias de los datos) en los diferentes sitios de la red aumentan la disponibilidad.
En una base de datos distribuida se pueden presentar fallos frecuentemente, a pesar de esto, la disponibilidad de los datos
es mayor porque regularmente slo afectan al sitio donde se origin, y la base de datos completa no se ver afectada. Las rplicas
permiten que las aplicaciones continen con su ejecucin cuando se presenta un fallo en el sitio donde se est realizando la
aplicacin, el sistema localiza una copia en otro sitio para acceder a los datos requeridos por la aplicacin y as esta pueda continuar.
La confiabilidad se refiere al hecho de que los datos estn consistentes, a pesar de cualquier desastre que se presente en el
sitio; cuando se modifica un fragmento en un sitio se deben actualizar todas las rplicas que se tengan de este, adems, cuando se
efecta una transaccin esta debe concluir completamente y si no es as, se debe deshacer cualquier cambio hecho a la base de
datos para que quede como estaba antes de iniciar la transaccin.
Algunas de las razones que fueron descritas tienen relacin entre s, ya que a partir de una se da por consiguiente otra de
ellas, por ejemplo, la descentralizacin se presenta a medida que las empresas crecen, en este caso se est presentando un
crecimiento incremental, en el diseo de BDD se consideran los crecimientos futuros ya que se pueden aadir sitios en cualquier
instante sin afectar el funcionamiento de los sitios ya existentes. Tambin se puede dar el caso que la empresa descentralizada ya
cuente con bases de datos y que requiera la integracin de estas, por tanto una BDD es conveniente porque los datos se pueden
mantener en donde se requiera un mayor uso y esto reduce la sobrecarga de comunicacin asimismo mejora el rendimiento de la
base de datos.
Distribucin: esta caracterstica corresponde al hecho de tener a los datos almacenados en ms de un sitio.
Correlacin lgica: se refiere a que los datos que estn ubicados en los diferentes sitios poseen algunas propiedades
que los mantiene lgicamente relacionados; si no tuvieran una propiedad en comn sera como si cada sitio tuviera su
propia base de datos.
Bases de datos distribuidas homogneas. En este tipo de base de datos, segn Silberschatz, todos los sitios tienen
sistemas manejadores de bases de datos idnticos, estn conscientes de la existencia de los dems sitios y acuerdan
cooperar en el procesamiento de las solicitudes de los usuarios.
En base a la definicin anterior, la homogeneidad se da cuando todos los sitios utilizan el mismo SMBD, entre estos pueden
intercambiar datos en el momento que lo requieran, por ejemplo, cuando en un sitio se presente un problema que imposibilite
tener acceso a los datos locales, el SMBD debe buscar una copia de los datos en otro sitio para que los usuarios continen
con sus aplicaciones, por tal motivo el autor menciona que estn conscientes de la existencia de otros sitios.
Base de datos distribuida heterogneas. De acuerdo con Silberschatz, en este tipo de base de datos sitios diferentes
puede que utilicen esquemas diferentes y diferente software de gestin de sistemas de bases de datos. Es decir, una BDD
es heterognea cuando se ha formado a partir de bases de datos ya existentes, y por lo tanto cada uno de los sitios difiere en
la utilizacin del SMBD para la manipulacin de los datos.
Objetivos de diseo
Cuando se ha decidido implementar una BDD en una empresa, es importante conocer cul ha sido el objetivo para su creacin, ya
que dependiendo de esto es como se realizar la distribucin de los datos. Un problema en el diseo de bases de datos distribuidas
es tomar las decisiones para ubicar los datos en los sitios y tambin decidir qu copias se realizarn y en dnde se alojarn. Desde el
punto de vista del autor, es necesario conocer cul es el objetivo que se busca al distribuir los datos para de esta manera dar solucin
al problema de la distribucin de los mismos. Pelagatti propone cuatro objetivos:
a) Procesamiento local
b) Disponibilidad y confiabilidad de los datos distribuidos
c) Distribucin de carga de trabajo
d) Costos de almacenamiento y disponibilidad
a) Procesamiento local
6
Este objetivo es el ms comn, ya que los datos se reparten hacia los sitios que ms los utilizan, de esta manera aumentan las
aplicaciones locales y disminuyen las interacciones entre los sitios, realizndose estas ltimas slo en caso necesario. Cuando se
habla de aplicaciones locales no es en el hecho de que se ejecuten en una misma ubicacin fsica, sino que para la ejecucin de una
aplicacin, una computadora accede a su propia porcin de datos, es decir, donde se procese la ejecucin de la aplicacin es donde
debern estar almacenados los datos para acceder a estos, en el caso de que no fuera as la aplicacin es considerada global.
Aunque haya accesos remotos, si la computadora donde se lleva a cabo el procesamiento de datos accede a su propia porcin de
datos, estas se consideran locales.
El procesamiento local es adecuado para una empresa con estructura descentralizada, ya que cada rea cuenta con datos
propios los cuales son tiles para realizar sus funciones, al estar de esta manera los procesos que se realizan en cada una de las
reas son locales, mantenerlos de esta manera reduce el acceso a otro sitio, que es lo que se pretende con este objetivo. En algunas
organizaciones del 70 al 80 % los datos se generan en centros locales.
Los sitios pueden tener control local sobre el mantenimiento, almacenamiento y uso de datos creados y almacenados localmente,
es decir, tienen autonoma local pero esto no impide la comparticin de los datos. El procesamiento local tiene varias ventajas, como
las que se listan a continuacin:
Rapidez: se accede a los datos con ms velocidad porque residen en el sitio donde se usan con mayor frecuencia.
Fcil acceso a los datos. Porque se encuentran en el sitio donde se realiz la peticin.
Disminucin de la sobrecarga de comunicacin. El acceso a los datos de otro sitio ser menor por lo tanto el trfico en la red
se reduce evitando los cuellos de botella.
Mayor rendimiento de la red. Al ser los procesos locales, los enlaces de comunicacin se utilizarn menos y el trfico en la
red ser menor, esto es una ventaja cuando se realicen aplicaciones globales.
empresa a que compre un equipo que cuente con las capacidades requeridas. El costo del equipo depender de las capacidades con
las que cuente, entre mayor capacidad se requiera el costo se ir elevando.
Con una mala asignacin de los fragmentos en los sitios se adquiere como consecuencia la necesidad de adquirir equipo de
cmputo para el almacenamiento de los datos si es que no soporta el tamao del mismo o puede ser que haya sitios en los que no se
aprovecha la capacidad del equipo de cmputo.
Actualmente, con los bajos costos de las computadoras resulta ms econmico conectar pequeas computadoras con la
potencia equivalente a una gran de gran tamao, como es el mainframe. Por lo tanto, si lo que se busca es ahorro en el
almacenamiento se deben analizar las capacidades con los que cuentan los sitios.
Estos son los cuatro objetivos que propone el autor para que sean considerados en el diseo de distribucin de datos. Es
importante aclarar que no se pueden tomar en cuenta todos los objetivos porque al cumplir uno de ellos se impide el logro de otro,
como es el caso del procesamiento local y la carga de trabajo. Si se busca el procesamiento local puede ser que por lo menos un sitio
quede sobrecargado, y si se distribuye la carga de trabajo tal vez no se tenga el procesamiento local. Por eso es importante conocer
cul es la necesidad que tiene en la empresa para poder elegir el objetivo apropiado para la distribucin de los datos.
Diseo de fragmentacin
El diseo de fragmentacin consiste en dividir la base de datos en porciones ms pequeas, que forman los fragmentos. Para poder
realizar este proceso de manera eficiente se deben realizar una serie de tareas, de acuerdo con Pelagatti, lo primero que se tiene que
hacer es identificar las aplicaciones ms usuales o las que tienen mayor importancia para la empresa, estas deben ser detalladas para
obtener la siguiente informacin:
La frecuencia con la que se realiza la aplicacin, es decir, cada cuanto tiempo se realiza la peticin, ya sea en horas,
das, semanas, etc., y el nmero de estas ejecuciones en un determinado tiempo.
Toda la informacin que se adquiera de las aplicaciones es importante porque a travs de estas se van a identificar los
criterios sobre los que se basar el diseador para decidir cmo fragmentar la base de datos. Conforme se realice el anlisis de las
aplicaciones se van a ir detectando las relaciones globales que tienen mayor demanda as como los atributos que son ms solicitados.
Todo el estudio que se realiza a las aplicaciones permitir tambin detectar cuales relaciones globales sern fragmentadas y cules
no.
Una vez detectadas las aplicaciones y que se hayan definido los criterios que se utilizarn para fragmentar cada una de las
relaciones globales, se prosigue a realizar la fragmentacin de la base de datos, sta se puede realizar de tres maneras:
a) Vertical.- consiste en dividir los atributos de una relacin global; para esto se aplica una operacin de proyeccin.
b) Horizontal.- consiste en dividir las tuplas de una relacin global; se aplica una operacin de seleccin a la relacin global
correspondiente.
c) Mixto.- consiste en aplicar fragmentacin vertical a fragmentos horizontales o viceversa.
d) Existe una cuarta opcin, en la cual tambin se puede decidir no fragmentar una relacin global, porque tal vez sera ms
conveniente mantenerla completa.
Distribucin y replicacin
Cuando ya se tienen los fragmentos, lo que prosigue es determinar cmo los datos sern almacenados a travs de los sitios de la red, esto
corresponde al diseo de distribucin. Pero para que los datos sean ubicados adecuadamente, es necesario analizar las aplicaciones que
fueron detectadas al principio. Los detalles que pueden ser tiles para este diseo es el sitio de origen donde se ejecuta una aplicacin y su
frecuencia de uso, el anlisis se debe realizar con mayor cuidado para aquellas aplicaciones que son usados en ms de un sitio, para de
esta manera distinguir en donde son ms necesarias.
8
En el diseo de la distribucin de datos, tambin se determina si habr replicacin de los mismos o no. Cuando no hay replicacin,
slo consiste en que cada fragmento ser localizado nicamente en un sitio; en cambio si hay replicacin, algunos de los fragmentos se
encontrar en ms de un sitio de la BDD, puede haber replicacin completa en donde se replica toda la base de datos en cada sitio de la
BDD y replicacin parcial en donde los fragmentos son replicados en ms de un sitio, no en todos.
Se debe definir que fragmentos sern replicados, cuantas copias sern necesarias y en que sitios se alojarn, estas decisiones
dependern de las aplicaciones, en otras palabras, de la importancia de los datos y tambin de la necesidad de los mismos en cada uno de
los sitios. Si la mayora de las aplicaciones son de actualizacin, no sera conveniente tener demasiadas copias porque es ms complicado
la actualizacin de todas las rplicas, en este ltimo caso se debe limitar la replicacin. Por medio de las rplicas aumenta la disponibilidad
de los datos.
Con el anlisis cuidadoso que se realice a las aplicaciones se determinara la mejor manera para fragmentar y distribuir los datos,
todo esto correspondiendo con el objetivo de diseo que fue seleccionado. Para saber qu fragmentos corresponden a una relacin global
se crea un esquema de fragmentacin, pero tambin se debe conocer la ubicacin de cada uno de ellos, en este caso se crea un esquema
de localizacin. Los fragmentos que estn situados en un determinado sitio y que corresponden a una misma relacin forman la imagen
fsica de la relacin global.