Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FECHA DE ENTREGA:
05- ABRIL- 2020
INTRODUCCIÓN:
¿QUÉ ES UN DBMS?
DESARROLLO:
ARQUITECTURA DE UN DBMS
ALMACENAMIENTO EN DISCO
GESTOR DE ALMACENAMIENTO
PROCESADOR DE CONSULTAS
USUARIOS
Por último, observamos a los usuarios de la base de datos que interactúan cada
uno de llos a través de su interfaz.
RAID 0
Este tipo de configuración también es una de las más populares, sobre todo a
nivel profesional, y podemos definirla como la cara opuesta a la anterior, ya que
su objetivo no es mejorar el rendimiento, sino conseguir la redundancia de datos.
RAID 10 Y RAID 01
RAID 5
Dentro de una RAID 5 encontramos un mínimo de tres discos duros, en los cuales los
datos se dividen en bloques. Para entender su funcionamiento de nuevo recurrimos a
una imagen. Fijaos, bajo esta configuración si un equipo quiere leer el dato A1 el
encargado de servirlo es el disco cero. Pues bien, si el equipo necesita también el dato B1
tendría que esperar, ya que el disco está sirviendo el dato A1 (está trabajando), pero si
necesita el dato B2 éste sí podría ser servido a la vez, ya que se encargaría el disco 1.
¿Qué significa esto? Pues que podemos realizar operaciones de lectura y escritura de
forma solapada, lo que supone un mayor rendimiento y una mayor eficiencia. Bien, ¿y
cómo se consigue la redundancia? La clave reside en los bloques de paridad, que se
utilizan para reconstruir los datos si una unidad del grupo RAID falla.
Así, cada vez que se escribe un bloque de datos (A1, A2, étc) en una RAID 5 se genera
un bloque de paridad dentro de la misma división, que puede ser recuperado y
recalculado junto con los demás bloques de datos en caso de fallo. Dicho de forma simple
por si no os queda claro, viene a ser una especie de recopilación de «trozos de datos de
las distintas unidades de almacenamiento.
RAID 6
Como habréis podido intuir esto supone una gran ventaja frente a la RAID 5, ya
que esa segunda banda de paridad actúa como respaldo ante una posible pérdida
de datos en caso de fallo o avería que afecte a una segunda unidad dentro del
grupo RAID, es decir, pasa de tolerar el fallo de una unidad a un máximo de dos
unidades. Pero esto no es todo, esto mejora además la experiencia de uso con
unidades SATA de gran capacidad de almacenamiento.
Sin embargo no todo son ventajas, también presenta inconvenientes. Uno de los
más importantes es su bajo nivel de rendimiento cuando necesitamos realizar la
reconstrucción de dos unidades de forma simultánea, ya que puede
producirse una penalización de hasta un 20% a nivel de desempeño.
RAID 50
También llamada RAID 5+0. Se define como una configuración que coge bloques
de RAID 5 y los distribuye formando una única RAID 0, tal y como podemos ver en
la imagen que acompañamos. Recuerda a la RAID 10 y es normal, ya que
básicamente su objetivo es ofrecer lo mejor de una RAID 5 y una RAID 0.
Con una configuración de este tipo el usuario disfruta de la paridad distribuida que
ofrece una configuración RAID 5, pero también del buen nivel de rendimiento que
caracteriza a una RAID 0. Gracias a dicha paridad un disco de cada conjunto RAID
5 puede fallar sin que nos expongamos a perder datos, aunque si no sustituimos el
disco que ha fallado los discos restantes de ese conjunto se convierten en un
punto único de fallo. Esto quiere decir que si falla otro disco dentro del mismo
conjunto perderemos todos los datos.
El tiempo necesario de recuperación, que incluye detectar y responder al fallo de
disco y reconstruir el conjunto sobre el nuevo disco, representa un periodo de
vulnerabilidad del conjunto RAID, así que debemos tenerlo muy en cuenta.
Al utilizar esta configuración con un conjunto de siete discos obtenemos una
elevada capacidad de almacenamiento y maximizamos la eficiencia en términos
de almacenamiento disponible, debido al tema de la paridad distribuida que
os explicamos al hablar sobre la RAID 5. Contaremos, además, con una tolerancia
máxima de tres fallos potenciales de disco, uno por cada conjunto.
¿QUE ES EL BUFFER?
Los datos que entran se almacenan primero en el buffer, quien los va dejando salir
hacia el otro dispositivo poco a poco, regulando su salida y permitiendo que el
usuario pueda seguir trabajando sin tantos altibajos de rendimiento. Esto es el
llamado buffer de datos. Un buffer puede ser muy variado en tamaño y en función,
pero siempre será una memoria que actúa de intermediaria entre un elemento que
da una información y otro que la recibe.
Aunque este sería el resumen simple, lo cierto es que existen muchos tipos
distintos de buffers y de métodos, pero en casi todos los casos el objetivo es
liberar al dispositivo principal de datos para permitirle seguir funcionando
óptimamente. Son de especial importancia en la comunicación entre dispositivos
(o funciones dentro de un mismo dispositivo) que requieren distintos tiempos para
ejecutarse.
La primera vez en la que se habló del termino Buffer fue en el año 1952, por
Russel A. Kirsch.
Algunos de los problemas más comunes que se dan son el desbordamiento, esto
pasa cuando el tamaño del Buffer es demasiado pequeño para almacenar toda la
información, subdesbordamiento, que es el problema ocasionado por la falta de
datos requeridos por el otro programa.
Caché de pista. Similar a la RAM, este tipo de memoria caché sólida empleada por
supercomputadores es potente, pero costosa.
Los sitios han sido diseñados para trabajar en conjunto, con el fin de que un
usuario de cualquier posición geográfica pueda obtener acceso a los datos desde
cualquier punto de la red tal como si todos los datos estuvieran almacenados en la
posición propia del usuario. Entonces, la llamada "Base de Datos Distribuida" es
en realidad una especie de “objeto virtual”, cuyos componentes se almacenan
físicamente en varias “bases de datos reales” ubicadas en diferentes sitios. En
esencia es la unión lógica de esas diferentes bases de datos.
En otras palabras, cada sitio tiene sus propias “bases de datos reales" locales, sus
propios usuarios locales, sus propios SGBD y programas para la administración de
transacciones y su propio administrador de comunicación de datos. Así pues, el
sistema de bases de datos distribuidas puede considerarse como una especie de
sociedad entre los diferentes SGBD individuales locales. Un nuevo componente de
software en cada sitio realiza las funciones de sociedad necesarias; y es la
combinación de este nuevo componente y el SGBD ya existente constituyen el
llamado Sistema de Administración o Gestión de Bases de Datos Distribuidas -
SGBDD. (En ingles DDBMS, Distributed DataBase Management System).
Desde el punto de vista del usuario final, un sistema distribuido deberá ser idéntico
a un sistema no distribuido. Los usuarios de un sistema distribuido se comportan
en su manipulación de información exactamente como si el sistema no estuviera
distribuido. Todos los problemas de los sistemas distribuidos son de tipo interno o
a nivel de realización, no pueden existir problemas de tipo externo o a nivel del
usuario final.
¿QUE ES OLTP Y OLAP?
Principales diferencias
El punto que distingue a OLTP y OLAP es que OLTP es un sistema de
transacciones en línea, mientras que OLAP es un sistema de recuperación
y análisis de datos en línea.
OLTP tiene transacciones cortas pero frecuentes, mientras que OLAP tiene
transacciones largas y menos frecuentes.
Las consultas OLAPs son más complejas con respecto a los OLTPs.
Lo que todos lo que estos almacenes de datos tienen en común están que no
utilizan un modelo relacional. Además, tienden a ser más específicos en el tipo de
datos que admiten y en cómo se pueden consultar los datos. Por ejemplo, los
almacenes de datos de serie temporal tiempo se optimizan para las consultas en
secuencias de datos basadas en tiempo, mientras que los almacenes de datos de
grafos se optimizan optimizados para explorar las relaciones ponderadas entre
entidades. Ninguno de los formatos se generalizaría bien en la tarea de
administrar datos transaccionales.
Ventajas
Versatilidad: La principal ventaja por la cual esta nueva tecnología difiere de las
demás soluciones de bases de datos es la versatilidad que ofrece a crecimientos o
cambios sobre la forma como almacena la información, si fuera necesario agregar
un nuevo campo sobre una “colección” (en base de datos relacional se definen
tablas), dado que se basa sobre una notación ligera de intercambio de
documentos baso en notación JSON(Java Script Object Notation), simplemente se
agregan sobre el documento y el sistema sigue operando sin agregar
configuraciones extras.
Optimización: Los sistemas NoSQL tienen un algoritmo interno para reescribir las
consultas escritas por los usuarios o las aplicaciones programadas, esto con el fin
de no sobrecargar el rendimiento de los servidores y mantener un nivel óptimo en
las operaciones.
Desventajas
Herramientas GUI (Graphical User Interface): Las herramientas que ofrecen para
la administración de estas herramientas, suelen tener acceso por consola, no
tienen una interfaz gráfica, se requiere conocimiento amplio de las instrucciones a
utilizar para su mantenimiento.
RELACIONAL
Ventajas y Desventajas
Ventajas
Desventajas
Presentan deficiencias con datos gráficos, multimedia, CAD y sistemas de
información geográfica.
CONLCUSIONES:
• Mediante el uso del DBMS, una empresa le permite crear base de dato con el fin
de mantener toda su Informacion o archivos de forma organizada; es decir, facilita
al usuario obtener datos de forma rápida.
REFERENCIAS:
(MARTINEZ, 2010)
(http://ley55.blogspot.com, 2014)
(C, 2015)
(Ros, 2019)
(tecnologicon, 2015)
(https://concepto.de/memoria-cache/)
(http://froac.manizales.unal.edu.co)
(https://pc-solucion.es/2018/04/23/diferencias-entre-oltp-y-olap/)
(https://aukera.es/)
(https://aws.amazon.com)
(microsoft, 2018)
(http://sergioyrafael-informatica.blogspot.com, 2011)
(https://medium.com/@marlonmanzo, 2016)
(https://deyde.es)
(https://blog.powerdata.es, 2015)