Está en la página 1de 14

INSTITUTO TECNOLOGICO SUPERIOR DE

COATZACOALCOS

TOPICOS DE BASES DE DATOS

Tema: Conceptos de Bases de datos distribuidos


Alumno: Santos Deceano Romn
Grado y grupo: 7 A
Carrera: Ingeniera Informtica
Docente: ISC Eder Lazo Hernndez

Coatzacoalcos, Ver. A 12 de noviembre de 2016


Introduccin

En este trabajo se definen los principales conceptos y


estructuras de cmo estn conformadas las bases de
datos distribuidas, las bases de datos distribuidas
surgieron como una alternativa para el
almacenamiento centralizado ya que este produca
demasiados inconvenientes, es por esto que se impuls
a la creacin del almacenamiento distribuido el cual
provee un mejor manejo de la informacin, y crea una
buena combinacin entre lo que son las redes y las
bases de datos

1.1 Conceptos bsicos de base de datos


Es una coleccin de datos que pertenecen lgicamente a un
slo sistema, pero se encuentra fsicamente esparcido en
varios sitios de la red. Un sistema de base de datos
distribuidas se compone de un conjunto de sitios, conectados
entre s mediante algn tipo de red de comunicaciones, en el
cual:
Cada sitio es un sistema de base de datos en s mismo.
Los sitios han convenido en trabajar juntos (si es necesario)
con el fin de que un usuario de cualquier sitio pueda obtener
acceso a los datos de cualquier punto de la red tal como si
todos los datos estuvieran almacenados en el sitio propio del
usuario.
El procesamiento de bases de datos distribuidas es el proceso
en el cual la ejecucin de transacciones y la recuperacin y
actualizacin de los datos acontece a travs de dos o ms
computadoras independientes, por lo general separadas
geogrficamente.
Las Bases de Datos Distribuidas, no son simplemente
implementaciones distribuidas de bases de datos
centralizadas, porque ellas permiten el diseo de sistemas que
representan diferentes caractersticas de las tradicionales, de
sistemas centralizados. Esto es por lo tanto til para ver las
caractersticas tpicas de BDD. Los rasgos que caracterizan los
BD tradicionales se aproximan al control centralizado,

independencia de datos, reduccin de redundancia,


estructuras fsicas complejas para acceso eficiente, integridad,
recuperacin control de concurrencia, privacidad y seguridad.
Los principales factores que distinguen un SBDD de un
sistema centralizado son los siguientes:
Hay mltiples computadores, llamados sitios o nodos.
Estos sitios deben de estar comunicados por medio de algn
tipo de red de comunicaciones para transmitir datos y rdenes
entre los sitios.
Las caractersticas de las bases de las bases de datos son las
siguientes: Autonoma Local: Los sitios distribuido deben ser
autnomos, es decir que todas las operaciones en un sitio
dado se controlan en ese sitio. No dependencia de un sitio
central: No debe de haber dependencia de un sitio central para
obtener un servicio. Operacin Continua: Nunca debera
apagarse para que se pueda realizar alguna funcin, como
aadir un nuevo sitio. Independencia con respecto a la
localizacin: No debe de ser necesario que los usuarios sepan
dnde estn almacenados fsicamente los datos, sino que ms
el usuario lo debe de ver como si solo existiera un sitio local
Independencia con respecto a la fragmentacin: La
fragmentacin es deseable por razones de desempeo, los
datos, pueden almacenarse en la localidad donde se utilizan
con mayor frecuencia de manera que la mayor parte de las
operaciones sean slo locales y se reduzca el trfico en la red.
Independencia de rplica: Si una relacin dada (es decir, un

fragmento dado de una relacin) se puede presentar en el


nivel fsico mediante varias copias almacenadas o rplicas, en
muchos sitios distintos

1.2 Objetivos de la base de datos


1. Independencia lgica y fsica de los datos. Se refiere a la
capacidad de modificar una definicin de esquema en un nivel de la
arquitectura sin que esta modificacin afecte al nivel inmediatamente
superior. El conjunto de datos contenidos en la base debe ser nica y
estar integrada por los mismos datos.
2. Redundancia mnima. Debe ser controlada, de forma que no
exista duplicidad innecesaria, y que las redundancias fsicas,
convenientes muchas veces a fin de responder a objetivos de eficiencia,
sean tratadas por el mismo sistema, de modo que no puedan
producirse inconsistencias. Se trata de usar la base de datos como
repositorio comn de datos para distintas aplicaciones.
Un dato se actualizar lgicamente por el usuario en forma nica, y el
sistema se preocupar de cambiar fsicamente todos aquellos campos
en los que el dato estuviese repetido en caso de existir redundancia
fsica (redundancia controlada).
3. Acceso concurrente por parte de mltiples usuarios. Las
bases de datos pretenden servir al conjunto de de la organizacin,
manejando los datos como otro recurso. Por lo tanto, las bases de datos
han de atender a mltiples usuarios y a diferentes aplicaciones. En
contraposicin a los sistemas de ficheros, en donde cada fichero
atiende a determinada aplicacin.
4. Distribucin espacial de los datos. Los datos pueden
encontrarse en otra habitacin, otro edificio e incluso otro pas, el

usuario no tiene por qu preocuparse de la localizacin espacial de los


datos a los que accede.
5. Integridad de los datos. Se refiere a las medidas de seguridad
que impiden que se introduzcan datos errneos. Esto puede suceder
tanto por motivos fsicos (defectos de hardware, actualizacin
incompleta debido a causas externas), como de operacin
(introduccin de datos incoherentes).
6. Consultas complejas optimizadas. permite la rpida y
ejecucin de las mismas.
7. Seguridad de acceso y auditora. Se refiere al derecho de acceso
a los datos contenidos en la base por parte de personas y organismos.
El sistema de auditora mantiene el control de acceso a la base, con el
objeto de saber qu o quin realiz una determinada modificacin y en
qu momento. Por ejemplo, un profesor quiere cambiar una
calificacin por alguna omisin, el sistema de la base le permitir hacer
el cambio, pero quedara el registro del da y el motivo del cambio, esto
lo checan los jefes de academia y observan si el profesor le ayuda al
alumno o realizan su trabajo adecuadamente.
8. Respaldo y recuperacin. Se refiere a la capacidad de un sistema
de base de datos de recuperar su estado en un momento previo a la
prdida de datos.
9. Acceso a travs de lenguajes de programacin estndar. Se
refiere a la posibilidad ya mencionada de acceder a los datos de una
base mediante lenguajes de programacin ajenos al sistema de base de
datos.
En pocas palabras son los programas o software con los que se
mandarn llamar y disear los datos que aparecern en la pantalla.

1.3 Disciplinas de bases de datos distribuidas

Los sistemas de bases de datos distribuidas son un caso particular de


los sistemas de cmputo distribuido en los cuales un conjunto de
elementos de procesamiento autnomos (no necesariamente
homogneos) se interconectan por una red de comunicaciones y
cooperan entre ellos para realizar sus tareas asignadas.
Histricamente, el cmputo distribuido se ha estudiado desde muchos
puntos de vista. As, es comn encontrar en la literatura un gran
nmero de trminos que se han usado para identificarlo.
Entre los trminos ms comunes que se utilizan para referirse al
cmputo distribuido podemos encontrar: funciones distribuidas,
procesamiento distribuido de datos, multiprocesadores,
multicomputadoras, procesamiento satelital, procesamiento tipo
"backend", computadoras dedicadas y de propsito especfico, sistemas
de tiempo compartido, sistemas funcionalmente modulares.
Existen muchas componentes a distribuir para realizar una tarea. En
computacin distribuida los elementos que se pueden distribuir son:
Control. Las actividades relacionadas con el manejo o administracin
del sistema.
Datos. La informacin que maneja el sistema.
Funciones. Las actividades que cada elemento del sistema realiza.
Procesamiento lgico. Las tareas especficas involucradas en una
actividad de procesamiento de informacin.

1.4 Arquitectura de bases de datos distribuidas


La arquitectura general de un sistema de bases de datos distribuida,
introducir el concepto de fragmentacin de datos relacionado con el
nivel de transparencia de distribucin que un SBDD debe ofrecer. Se

dar una descripcin acerca de las componentes de las bases de datos


distribuidas.
La arquitectura define la estructura de un sistema. Al definir la
arquitectura se deben identificar las componentes de un sistema, las
funciones que realiza cada una de las componentes y las interrelaciones
e interacciones entre cada componente. Desde el punto de vista de las
bases de datos, conceptualmente existen tres tipos de ambientes que se
integran con mltiples procesadores:
Arquitecturas de memoria compartida. Consisten de diversos
procesadores los cuales accedan una misma memoria y una misma
unidad de almacenamiento (uno o varios discos). Algunos ejemplos de
este tipo son las computadoras Sequent Encor y los mainframes
IBM4090 y Bull DPS8
Arquitecturas de disco compartido. Consiste de diversos
procesadores cada uno de ellos con su memoria local, pero
compartiendo una misma unidad de almacenamiento (uno o varios
discos). Ejemplos de estas arquitecturas son los clsteres de Digital, y
los modelos IMS/VS Data Sharing de IBM
Arquitecturas nada compartido. Consiste de diversos
procesadores cada uno con su propia memoria y su propia unidad de
almacenamiento. Aqu se tienen los clsteres de estaciones de trabajo,
las computadoras Intel Paragn, NCR 3600 y 3700 e IBM SP2

1.5 Definicin de termino cliente-servidor


La Arquitectura Cliente/Servidor. Es un modelo para el desarrollo de
sistemas de informacin en el que las transacciones se dividen en
procesos independientes que cooperan entre s para intercambiar
informacin, servicios o recursos. Se denomina cliente al proceso que

inicia el dilogo o solicita los recursos y servidor al proceso que


responde a las solicitudes.
Arquitecturas mltiples clientes / mltiples servidores. Son ms
flexibles, ya que la base de datos es distribuida en varios servidores.
Cada cliente tiene un servidor directo al cual hace sus peticiones. La
comunicacin entre los servidores ejecuta las transacciones y
peticiones de los usuarios y esta es transparente para ellos.
Arquitecturas de igual a igual. Un DBMS verdadero no distingue entre
cliente y servidor. Idealmente cada mquina puede desempear la
funcionalidad de cliente y de servidor. La base de datos es fsicamente
distribuida en diferentes lugares fragmentado y replicando los datos.
La fragmentacin es deseable ya que hace posible el poner los datos
cerca de los usuarios que los necesitan, de esta forma reduciendo
potencialmente el costo de la transmisin y reduciendo el tamao de
las relaciones involucradas en las consultas de los usuarios.
Entre las principales caractersticas de la arquitectura cliente/servidor
se pueden destacar las siguientes:
El servidor presenta a todos sus clientes una interfaz nica y bien
definida.
El cliente no necesita conocer la lgica del servidor, slo su
interfaz externa.
El cliente no depende de la ubicacin fsica del servidor, ni del
tipo de equipo fsico en el que se encuentra, ni de su sistema
operativo.
Los cambios en el servidor implican pocos o ningn cambio en el
cliente.
En la arquitectura C/S el remitente de una solicitud es conocido
como cliente. Sus caractersticas son:
Es quien inicia solicitudes o peticiones, tienen por tanto un papel
activo en la comunicacin (dispositivo maestro o amo).

Espera y recibe las respuestas del servidor.


Por lo general, puede conectarse a varios servidores a la vez.
Normalmente interacta directamente con los usuarios finales
mediante una interfaz grfica de usuario.

1.6 Arquitectura cliente-servidor


ARQUITECTURA DE 2 CAPAS. La arquitectura cliente/ servidor
tradicional es una solucin de 2 capas. La arquitectura de 2 capas
consta de tres componentes distribuidos en dos capas: cliente
(solicitante de servicios) y servidor (proveedor de servicios). Los tres
componentes son:
Interfaz de usuario.
Gestin del procesamiento.
Gestin de la base de datos.
Hay 2 tipos de arquitecturas cliente servidor de dos capas:
Clientes obesos (thick clients): La mayor parte de la lgica de la
aplicacin (gestin del procesamiento) reside junto a la lgica de la
presentacin (interfaz de usuario) en el cliente, con la porcin de
acceso a datos en el servidor.
Clientes delgados (thin clients): solo la lgica de la presentacin
reside en el cliente, con el acceso a datos y la mayora de la lgica de la
aplicacin en el servidor.
Es posible que un servidor funcione como cliente de otro servidor. Esto
es conocido como diseo de dos capas encadenado.

Limitaciones
El nmero usuarios mximo es de 100. Ms all de este nmero de
usuarios se excede la capacidad de procesamiento.
No hay independencia entre la interfaz de usuario y los tratamientos, lo
que hace delicada la evolucin de las aplicaciones.
Dificultad de relocalizar las capas de tratamiento consumidoras de
clculo.
Reutilizacin
arquitectura.

delicada

del

programa

desarrollado

bajo

esta

ARQUITECTURA DE 3 CAPAS. La arquitectura de 3 capas surgi


para superar las limitaciones de la arquitectura de 2 capas. La tercera
capa (servidor intermedio) est entre el interfaz de usuario (cliente) y el
gestor de datos (servidor). La capa intermedia proporciona gestin del
procesamiento y en ella se ejecutan las reglas y lgica de
procesamiento. Permite cientos de usuarios (en comparacin con slo
100 usuarios de la arquitectura de 2 capas). La arquitectura de 3 capas
es usada cuando se necesita un diseo cliente / servidor que
proporcione, en comparacin con la arquitectura de 2 capas,
incrementar el rendimiento, flexibilidad, mantenibilidad, reusabilidad
y escalabilidad mientras se esconde la complejidad del procesamiento
distribuido al usuario.

Limitaciones

Construir una arquitectura de 3 capas es una tarea complicada. Las


herramientas de programacin que soportan el diseo de arquitecturas
de 3 capas no proporcionan todos los servicios deseados que se
necesitan para soportar un ambiente de computacin distribuida. Un
problema potencial en el diseo de arquitecturas de 3 capas es que la
separacin de la interfaz grfica de usuario, la lgica de gestin de
procesamiento y la lgica de datos no es siempre obvia. Algunas lgicas
de procesamiento de transacciones pueden aparecer en las 3 capas. La
ubicacin de una funcin particular en una capa u otra debera basarse
en criterios como los siguientes:
Facilidad de desarrollo y comprobacin.
Facilidad de administracin.
Escalabilidad de los servidores.
Funcionamiento (incluyendo procesamiento y carga de la red).

1.7 Integracin de datos vs distribucin de


datos
En un sistema de base de datos distribuida, los datos se almacenan en
varios computadores. Los computadores de un sistema distribuido se
comunican entre s a travs de diversos medios de comunicacin, tales
como cables de alta velocidad o lneas telefnicas. No comparten la
memoria principal ni el reloj. Los procesadores de un sistema
distribuido pueden variar en cuanto su tamao y funcin. Pueden
incluir microcomputadores pequeos, estaciones de trabajo y sistemas
de computadores grandes de aplicacin general. Estos procesadores
reciben diferentes nombres, tales como localidades, nodos o
computadores. Un sistema distribuido de bases de datos consiste en un
conjunto de localidades, cada uno de las cuales puede participar en la

ejecucin de transacciones que accedan a datos de una o varias


localidades. La diferencia principal entre los sistemas de base de datos
centralizados y distribuidos es que, en los primeros, los datos residen
en una sola localidad, mientras que, en los ltimos, se encuentran en
varias localidades.Mientras que la integracion de datos es la forma en
la que se va administrar los datos en el sistema.
La integracin de datos como un proceso de transformacin y
conciliacin de datos que permita una mayor agilidad en la gestin,
proporcionando datos conectados, seguros y de calidad.
Integrar significa combinar datos que se encuentran en diferentes
fuentes para permitirle al usuario final tener una vista unificada de los
mismos para una accesibilidad idnea, que sirva a las necesidades de
negocio. Actualmente, la aparicin de nuevas tecnologas y la explosin
de datos plantean un gran desafo en este aspecto, y ello se traduce en
una mayor complejidad tcnica a la hora de implementar un plan de
integracin de datos, si bien el objetivo sigue siendo el mismo: evitar su
fragmentacin mediante el desarrollo de soluciones ad hoc.

Conclusin
En este trabajo se aprendi de cmo estn conformadas
las bases distribuidas y sus principales conceptos ya
que pudimos conocer sus principales estructuras ya que
resulta importante tener el conocimiento de cmo
funcionan estas, ya que estas tienen la ventaja de poder
integrarse a otros sitios por medio de una red de
comunicacin.

También podría gustarte