Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos Relacionales - Qué Son y Por Qué Se Utilizan - 1&1 IONOS
Bases de Datos Relacionales - Qué Son y Por Qué Se Utilizan - 1&1 IONOS
HUNUCO-PERU
1/12
RELACION:
Un concepto capital del modelo relacional es el de relación, postulado por el matemático y teórico
de bases de datos Edgar F. Cid. Siguiendo al científico británico, una relación representa un
conjunto de entidades con las mismas propiedades. Cada relación se compone de una serie de
filas o registros (las llamadas tupas), cuyos valores dependen de ciertos atributos (columnas).
2/12
Db2
Con los usuarios disponen de un SGBD relacional propietario de la casa IBM.
Misal
Misal es el SGBD de código abierto más utilizado a nivel global.
Desde que pasa a las manos de Oracle, Misal se distribuye con una licencia dual. Sus primeros
desarrolladores siguen encargándose del proyecto, ahora bajo el nombre de Maread.
PostgreSQL
Con PostgreSQL usuarios disponen de un SGBD relacional libre y orientado a objetos de cuyo
continuo desarrollo se ocupa su comunidad open source.
Oracle Database
El programa de Oracle se distribuye como software propietario.
SQLite
por último, SQLite constituye una biblioteca de programas con licencia de dominio público que
contiene un gestor de bases de datos relacionales.
3/12
Cómo funcionan las bases de datos relacionales
Los datos estructurados en tablas constituyen la BD de un sistema relacional. El SGBD define su
estructura y gestiona también los permisos de escritura y lectura y para interactuar con él, los
usuarios utilizan un lenguaje de bases de datos. Todo gestor de bases de datos relacionales
soporta al menos un lenguaje formal que permite ejecutar las siguientes operaciones:
Definir la estructura de datos: en la definición de los datos se guarda una descripción con
metadatos de la estructura de datos en el diccionario del sistema. Cuando un usuario crea
una tabla nueva, en el diccionario de datos se almacena su correspondiente esquema. El
vocabulario de un lenguaje de bases de datos que se utiliza para definir los datos se
denomina Data Definición Lenguaje (DDL), lenguaje de definición de datos.
Definir derechos: todos los lenguajes de bases de datos proporcionan una sintaxis que
permite otorgar o retirar permisos. En este contexto se habla de Data Control Lenguaje (DCL)
o lenguaje de control de datos, un vocabulario integrado en el lenguaje de bases de datos.
4/12
Definir condiciones de integridad: por condiciones de integridad se entienden los
requisitos de estado que se exigen a un banco de datos. Si se definen condiciones para su
integridad, el BD garantiza que se cumplan en todo momento. Se habla entonces de un
estado consistente. Una condición básica de integridad en una base de datos relacional es,
por ejemplo, que cada registro (tupla) pueda identificarse de forma inequívoca.
Definir vistas: las llamadas views son vistas virtuales de un subconjunto de los datos de
una tabla. Para crear una vista, el SGBD genera una tabla virtual (relación lógica) sobre la
base de las tablas físicas. En estas vistas pueden emplearse las mismas operaciones que se
utilizarían en tablas físicas. Según la función de la vista de datos pueden distinguirse distintos
tipos de vista. Las más habituales son aquellas que filtran determinadas filas (consulta de
selección) o columnas (vista de columnas) de una tabla.
VENTAJAS
El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar
donde se utilizan.
El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una
carga de trabajo,
5/12
Nuevos nodos se pueden agregar fácil y rápidamente.
La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una
autonomía e independencia entre los nodos.
Control local de los datos con que se interactúa.
Mayor tolerancia a los fallos
DESVENTAJAS
Es más complicado el control y la manipulación de los datos
Es compleja el aseguramiento de la integridad de la información en presencia de fallas no
predecibles tanto de componentes de hardware como de software. La integridad se refiere a la
consistencia, validez y exactitud de la información.
El control de concurrencia y los mecanismos de recuperación son mucho más complejos que
en un sistema centralizado dado que los datos pueden estar replicados.
La distribución de la BD requiere determinar la fragmentación y la localización. La fragmentación
es el proceso de dividir una relación en pequeñas porciones llamadas fragmentos [Meghini,
1991]. Las razones principales para la fragmentación son el incremento del nivel de concurrencia
y el desempeño del sistema. Existen dos alternativas para fragmentar datos: fragmentación
horizontal (FH) y fragmentación vertical (FV). La combinación de las anteriores resulta en una
fragmentación híbrida. Es importante seguir tres reglas, las cuales aseguran que la BD no tenga
cambios semánticos durante la fragmentación: completitud, reconstrucción y disjuntura.
6/12
5. PROBLEMAS FUNDAMENTALES A RESOLVER EN LAS BASES
DE DATOS DISTRIBUIDAS
Diseño de bases de datos distribuidas
Procesamiento y optimización de consultas
VENTAJAS
7/12
Permitimos el procesamiento concurrente de transacciones ya que no se bloquean
tablas enteras sino subtablas, por lo que dos consultas pueden acceder a la misma
tabla a fragmentos distintos.
Permitimos la paralización de consultas al poder descomponerlas en su consultas, cada
una de la cuales trabajará con un fragmento diferente incrementándose así el
rendimiento.
DESVENTAJAS
Degradación del rendimiento en vistas definidas sobre varios fragmentos ubicados en
sitios distintos (es necesario realizar operaciones con esos trozos lo cual es costoso)
El control semántico se dificulta y el rendimiento se degrada debido que la verificación
de restricciones de integridad (claves ajenas, óniques, etc) implican buscar fragmentos
en múltiples localizaciones.
Por lo tanto, división y ubicación de los fragmentos no es trivial.
Son aquellas que se ejecutan sobre múltiples procesadores y discos que han sido
diseñados para ejecutar operaciones en paralelo, cuando sea posible, con el propósito de
mejorar el rendimiento.
8/12
Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la
utilización de UCP y discos en paralelo. La fuerza que ha impulsado a los sistemas
paralelos de bases de datos ha sido la demanda de aplicaciones que han de manejar
bases de datos extremadamente grandes (del orden de terabytes, esto es, 1012 bytes) o
que tienen que procesar un número enorme de transacciones por segundo (del orden de
miles de transacciones por segundo).
Los sistemas paralelos de base de datos constan de varios procesadores y varios discos
conectados a través de una red de interconexión de alta velocidad. Para medir el
rendimiento de los sistemas de base de datos existen 2 medidas principales:
1. La productividad (throughput) que se entiende como el número de tareas que pueden
completarse en un intervalo de tiempo determinado.
2. El tiempo de respuesta (response time) que es la cantidad de tiempo que necesita para
completar una única tarea a partir del momento en que se envíe. Un sistema que procese un
gran número de pequeñas transacciones puede mejorar su productividad realizando muchas
transacciones en paralelo. Un sistema que procese transacciones más largas puede mejorar
tanto su productividad como sus tiempos de respuesta realizando en paralelo cada una de
las sus tareas de cada transacción.
Paralelismo en consultas
Es la ejecución en paralelo de una única consulta entre varios procesadores y
discos, cuyo objetivo es acelerar las consultas de ejecución prologada. Por
tanto, se puede hacer paralelas las consultas haciendo paralelas las
operaciones que las forman. Existen dos maneras de ejecutar en paralelo
una sola consulta:
· Paralelismo en operaciones. Se puede acelerar el procesamiento de las
consultas haciendo paralela la ejecución de cada una de sus operaciones
individuales ordenación, selección, proyección y reunión.
· Paralelismo entre Operaciones. Se puede acelerar el procesamiento de la
consulta ejecutando en paralelo las diferentes operaciones de las
expresiones de las consultas.
Por lo tanto, el objetivo que se persigue es dividir la relación que interviene en
la consulta por medio de técnicas de división de relaciones, guardar dichas
relaciones en discos que van a ser gestionados cada uno de ellos por un
procesador, a su vez, cada procesador ejecuta su consulta local y cada uno
de estos resultados parciales se unen para formar la respuesta a la consulta.
Arquitectura
9/12
Aspectos Importantes de los SBDP
10/12
CONCLUCIONES Y RECOMENDACIONES.
CONCLUCIONES:
Modelo relacional
Siendo el modelo más común, el modelo relacional ordena los datos en tablas,
también conocidas como relaciones, cada una de las cuales se compone de
columnas y filas. Cada columna enumera un atributo de la entidad en cuestión, por
ejemplo, precio, código postal o fecha de nacimiento. En conjunto, a los atributos
en una relación se los llama dominio. Se elige un atributo particular o combinación
de atributos como clave primaria, a la cual se puede hacer referencia en otras tablas,
en donde se la denomina clave externa.
Cada fila, también denominada tulpa, incluye datos sobre una instancia específica
de la entidad en cuestión, por ejemplo, un empleado específico.
11/12
comunes las máquinas paralelas, lo que hace que cada vez sea más
importante el estudio de los sistemas paralelos de bases de datos. La fuerza
que ha impulsado a los sistemas paralelos de bases de datos ha sido la
demanda de aplicaciones que han de manejar bases de datos extremadamente
grandes (del orden de terabytes, esto es, 1012 bytes) o que tienen que
procesar un número enorme de transacciones por segundo (del orden de miles
de transacciones por segundo). Los sistemas de bases de datos centralizados
o cliente-servidor no son suficientemente potentes para soportar tales
aplicaciones.
RECOMENDACIONES.
Esto es mi recomendación personal sobre los tres tipos de base de datos, claro
que hay muchos más.
Modelo relacional, este modelo es el más usado, lo recomiendo mucho, almenas yo
lo uso porque el modelo relacional está basado en la teoría de conjuntos ya que de
ahí nos podemos guiar de las propiedades de la teoría de conjuntos para poder
guiarnos en nuestras operaciones
Y sobre todo porque estas basado en la lógica de predicados,
Ahora veamos si nosotros queremos trabajar con sistemas más grandes podemos
usarlas las bases de datos distribuidas aparte de que los sistemas relacionales son
no jerárquicos, por ejemplo, si tuviéramos una cadena de restaurants los sistemas
distribuidos serían muy bueno, pero también tendría un costo mucho superior al del
modelo relacional,
Los sistemas paralelos son más eficaces mas rápidos muy útil por
cierto para un tráfico de datos muy elevado.
12/12