PP A1 Miguel - Morenobd

NOMBRE DE LA INSTITUCIÓN: U NIVERSIDAD L ATINOAMERICANA
PROGRAMA: L ICENCIATURA EN I NGENIERÍA EN R EDES Y N UEVAS T ECNOLOGÍAS

DE LA I NFORMACIÓN
CLAVE Y NOMBRE DE LA MATERIA : IEB-713-580-BASES DE DATOS I
NOMBRE DEL ENTREGABLE: “ARQUITECTURA DBMS”
NOMBRE DEL FACILITADOR: PSAUMIS ESCOBEDO DELGADO
NOMBRE DEL ESTUDIANTE: E DUARDO M IGUEL M ORENO
FECHA DE ENTREGA:
05- ABRIL- 2020
INTRODUCCIÓN:
¿QUÉ ES UN DBMS?
Un sistema manejador de bases de datos (SGBD, por sus siglas en inglés)

o DataBase Management System (DBMS) es una colección de software muy
específico, orientado al manejo de base de datos, cuya función es servir
de interfaz entre la base de datos, el usuario y las distintas aplicaciones utilizadas.
Como su propio nombre indica, el objetivo de los sistemas manejadores de base

de datos es precisamente el de manejar un conjunto de datos para convertirlos
en información relevante para la organización, ya sea a nivel operativo o
estratégico.
Lo hace mediante una serie de rutinas de software que permiten su uso de una

manera segura, sencilla y ordenada. Se trata, en suma, de un conjunto de
programas que realizan tareas de forma interrelacionada para facilitar
la construcción y manipulación de bases de datos, adoptando la forma de interfaz
entre éstas, las aplicaciones y los mismos usuarios.
Su uso permite realizar un mejor control a los administradores de sistemas y, por

otro lado, también obtener mejores resultados a la hora de realizar consultas que
ayuden a la gestión empresarial mediante la generación de la tan perseguida
ventaja competitiva.
DESARROLLO:
ARQUITECTURA DE UN DBMS
A continuación, se describe cómo es su arquitectura. Podemos ver sus

componentes y más adelante se explicarán algunos de ellos.

Un sistema gestor de bases de datos (SGBD) es una colección de datos

interrelacionados y un conjunto de programas para acceder a esos datos
COMPONENTES DE UN SISTEMA GESTOR DE BASES DE DATOS
ALMACENAMIENTO EN DISCO
Obervamos en la parte inferior del diagrama aparecen los datos en sí,

el diccionario de datos que contiene información sobre los datos y es un tipo
especial de tabla a la que solo tiene acceso el sistema de base de datos y no los
usuarios en general. El diccionario de datos almacena entre otros datos,
restricciones de seguridad e integridad (Date C. J., 2001). También están
los índices, que se utilizan para buscar más rápidamente un registro. Estos, junto
con los datos estadísticos son archivos que son almacenados en disco.
GESTOR DE ALMACENAMIENTO
Luego observamos una serie de programas. El primer grupo de programas se

encarga de gestionar el almacenamiento. Uno de ellos es el gestor de memoria
intermedia, que atiende solicitudes de consultas que involucran información
guardada en disco. Si esa información ya está en el gestor de memoria intermedia,
se le proporciona al programa solicitante, la dirección del bloque de memoria; de lo
contrario, se busca sitio en la memoria, se lee el disco, y se escribe en la memoria
intermedia, acto seguido, se le proporciona al solicitante la dirección del bloque.
El gestor de memoria intermedia atiende solicitudes de consultas que involucran

información guardada en disco.
El gestor de transacciones gestiona la ejecución de las transacciones o

subtransacciones que acceden a los datos almacenados. Una transacción es un
grupo de instrucciones (de consulta o actualización) que se deben ejecutar
asegurando las propiedades de Atomicidad, Consistencia, Aislamiento y
Durabilidad (ACID).
El gestor de archivos gestiona la asignación de espacio de almacenamiento en

disco. Y el gestor de autorizaciones e integridad, comprueba que se satisfagan las
restricciones de integridad y la autorización de los usuarios para tener acceso a
los datos.
PROCESADOR DE CONSULTAS
El otro grupo de programas se encarga de las consultas. Allí podemos observar

al intérprete de LDD (Lenguaje de Definición de Datos) que interpreta las
instrucciones del LDD y actualiza el diccionario de datos. También está
un compilador de LMD (Lenguaje de manipulación de datos) que traduce las
instrucciones del LMD que están en un lenguaje de consultas, a instrucciones de
bajo nivel que serán ejecutadas por el motor de evaluación de consultas. El motor
de evaluación de consultas es quien ejecuta las instrucciones de bajo nivel que le
pasa el compilador de LMD.
LDD = Lenguaje de Definición de Datos.
LMD = Lenguaje de manipulación de datos.
USUARIOS
Por último, observamos a los usuarios de la base de datos que interactúan cada
uno de llos a través de su interfaz.
Los usuarios normales son usuarios que no requieren preparación especial en el

manejo de base de datos y que utilizan el sistema a través de programas de
aplicación que han sido escritos para ellos. Los programadores de
aplicaciones son usuarios de la base de datos y escriben programas de aplicación.
Pueden llegar a utilizar herramientas DRA (Desarrollo Rápido de Aplicaciones),
con las que pueden crear formularios e informes con poco esfuerzo de
programación.
Los usuarios sofisticados son quienes utilizan la base de datos a través de

consultas escritas en un lenguaje de consultas. Y los usuarios especializados son
usuarios sofisticados que crean aplicaciones de bases de datos especializadas
que abarcan otros campos aparte del procesamiento tradicional de datos, por
ejemplo los sistemas expertos.
¿Y el Administrador de Bases de Datos? Entre sus tareas se encuentran las

siguientes:
 Crear el esquema de la base de datos, es decir el diseño lógico de la B.D.

 Definir la estructura y el método de acceso.
 Modificar el esquema y la organización física.
 Autoriza el acceso a la base de datos.
 Da mantenimiento de rutina a la B.D., lo que incluye hacer copias de seguridad,
asegurarse de que exista suficiente espacio libre, y supervisar el rendimiento del
sistema.
¿QUE SON LOS ARREGLOS RAID?
Tenemos un conjunto de cuatro siglas que significan «conjunto redundante de

discos independientes». Bien, haciendo una interpretación directa de esa
traducción debemos sacar en claro que se refiere a a la existencia de una
configuración basada en dos o más unidades de almacenamiento que trabajan de
forma conjunta.
Cuanto recurrimos a estas configuraciones podemos utilizar de forma coordinada
varias unidades de almacenamiento, tanto de tipo HDD como de tipo SSD, y
disfrutar de una serie de ventajas que dependerán directamente del tipo de RAID
que utilicemos.
Esto tiene una explicación muy sencilla, y es que cada tipo de
configuración asigna una función diferente a las unidades de almacenamiento
redundantes. Así, por ejemplo, podemos optar por mejorar el rendimiento o la
seguridad de los datos, o buscar un equilibrio entre ambos.
Sobre este tema vamos a hablar a continuación, haciendo un desglose completo
de los siete tipos de configuración RAID más utilizadas actualmente. Cada una
tiene sus ventajas, pero también sus desventajas, así que la elección de una u
otra dependerá, en última instancia, de nuestras necesidades.
RAID 0
Este tipo de configuración se distribuyen los datos de forma equilibrada entre

todas las unidades de almacenamiento utilizadas, lo que consigue aumentar la
velocidad de acceso a los datos. Esto se traduce, en definitiva, en un mayor
desempeño.
Una ventaja importante, pero por desgracia también presenta un gran

inconveniente que es lo que hace, precisamente, que tenga una mayor adopción
en entornos particulares y que sea menos popular en entornos profesionales: no
ofrece redundancia. Al distribuir los datos equitativamente entre unidades no hay
ninguna que actúe como respaldo, por lo que si se produce un fallo o una avería
en una de las unidades de almacenamientos perderemos todos los datos.
RAID 1
Este tipo de configuración también es una de las más populares, sobre todo a
nivel profesional, y podemos definirla como la cara opuesta a la anterior, ya que
su objetivo no es mejorar el rendimiento, sino conseguir la redundancia de datos.
Cuando utilizamos una configuración RAID 1 los datos de cada unidad de

almacenamiento se duplican de forma totalmente sincronizada en otra unidad de
almacenamiento. De esta manera, si se produce un fallo o avería en alguna de las
unidades no perderemos ningún dato, puesto que contaremos con la unidad de
respaldo.
Aunque el objetivo principal de esta configuración es asegurar la integridad de

nuestros datos y archivos en caso de desastre también existen otras ventajas
derivadas de esa redundancia, y es que las velocidades de lectura y de acceso a
los datos mejoran, ya que el sistema puede leerlos de dos unidades de
almacenamiento diferentes. Sin embargo, no hay mejora a nivel de escritura, ya
que el sistema trabaja como si solo hubiera una unidad de almacenamiento.
RAID 10 Y RAID 01
El uso de configuraciones RAID no es algo nuevo, y tampoco es exclusivo del

sector profesional. Con el paso de los años y la bajada de precio que han
experimentado los discos duros y las unidades SSD se han convertido en una
solución cada vez más popular dentro del sector de consumo general.
Pero no solo ha influido el precio de las unidades de almacenamiento, la

simplificación que han experimentado los procesos de configuración, gracias a la
introducción de BIOS simplificadas y a la llegada de UEFI, también ha jugado un
papel clave de cara a su popularización en el sector de consumo general.
RAID 5
Dentro de una RAID 5 encontramos un mínimo de tres discos duros, en los cuales los
datos se dividen en bloques. Para entender su funcionamiento de nuevo recurrimos a
una imagen. Fijaos, bajo esta configuración si un equipo quiere leer el dato A1 el
encargado de servirlo es el disco cero. Pues bien, si el equipo necesita también el dato B1
tendría que esperar, ya que el disco está sirviendo el dato A1 (está trabajando), pero si
necesita el dato B2 éste sí podría ser servido a la vez, ya que se encargaría el disco 1.
¿Qué significa esto? Pues que podemos realizar operaciones de lectura y escritura de
forma solapada, lo que supone un mayor rendimiento y una mayor eficiencia. Bien, ¿y
cómo se consigue la redundancia? La clave reside en los bloques de paridad, que se
utilizan para reconstruir los datos si una unidad del grupo RAID falla.
Así, cada vez que se escribe un bloque de datos (A1, A2, étc) en una RAID 5 se genera
un bloque de paridad dentro de la misma división, que puede ser recuperado y
recalculado junto con los demás bloques de datos en caso de fallo. Dicho de forma simple
por si no os queda claro, viene a ser una especie de recopilación de «trozos de datos de
las distintas unidades de almacenamiento.
RAID 6
En líneas generales estamos ante una configuración idéntica a una RAID 5, con la

particularidad de que se utiliza una segunda banda de paridad que se encuentra
distribuida también entre todos los discos de la RAID, lo que aumenta a cuatro el
número mínimo de unidades de almacenamiento necesarias.
Como habréis podido intuir esto supone una gran ventaja frente a la RAID 5, ya
que esa segunda banda de paridad actúa como respaldo ante una posible pérdida
de datos en caso de fallo o avería que afecte a una segunda unidad dentro del
grupo RAID, es decir, pasa de tolerar el fallo de una unidad a un máximo de dos
unidades. Pero esto no es todo, esto mejora además la experiencia de uso con
unidades SATA de gran capacidad de almacenamiento.
Sin embargo no todo son ventajas, también presenta inconvenientes. Uno de los
más importantes es su bajo nivel de rendimiento cuando necesitamos realizar la
reconstrucción de dos unidades de forma simultánea, ya que puede
producirse una penalización de hasta un 20% a nivel de desempeño.
Otro problema que presenta esta configuración es la capacidad real de

almacenamiento de que podremos disponer, ya que si tenemos, por ejemplo, una
RAID 6 con cuatro discos duros el espacio equivalente a dos de ellos se dedica a
la paridad. Esto quiere decir que si utilizamos cuatro discos duros de 2 TB cada
uno no dispondremos de 8 TB, sino que en realidad tendremos un total 4 TB de
espacio, ya que los otros 4 TB se dedican a paridad.
RAID 50
También llamada RAID 5+0. Se define como una configuración que coge bloques
de RAID 5 y los distribuye formando una única RAID 0, tal y como podemos ver en
la imagen que acompañamos. Recuerda a la RAID 10 y es normal, ya que
básicamente su objetivo es ofrecer lo mejor de una RAID 5 y una RAID 0.
Con una configuración de este tipo el usuario disfruta de la paridad distribuida que
ofrece una configuración RAID 5, pero también del buen nivel de rendimiento que
caracteriza a una RAID 0. Gracias a dicha paridad un disco de cada conjunto RAID
5 puede fallar sin que nos expongamos a perder datos, aunque si no sustituimos el
disco que ha fallado los discos restantes de ese conjunto se convierten en un
punto único de fallo. Esto quiere decir que si falla otro disco dentro del mismo
conjunto perderemos todos los datos.
El tiempo necesario de recuperación, que incluye detectar y responder al fallo de
disco y reconstruir el conjunto sobre el nuevo disco, representa un periodo de
vulnerabilidad del conjunto RAID, así que debemos tenerlo muy en cuenta.
Al utilizar esta configuración con un conjunto de siete discos obtenemos una
elevada capacidad de almacenamiento y maximizamos la eficiencia en términos
de almacenamiento disponible, debido al tema de la paridad distribuida que
os explicamos al hablar sobre la RAID 5. Contaremos, además, con una tolerancia
máxima de tres fallos potenciales de disco, uno por cada conjunto.
¿QUE ES EL BUFFER?
Definición de Buffer. Es el espacio de la memoria en un disco duro o en un

instrumento digital, también se utiliza para almacenar datos temporalmente
durante la realización de trabajos en el ordenador, se suele usar para que el
hardware o software se queden sin datos durante una transmisión de datos.
¿CÓMO FUNCIONA EL BUFFER?
Los datos que entran se almacenan primero en el buffer, quien los va dejando salir
hacia el otro dispositivo poco a poco, regulando su salida y permitiendo que el
usuario pueda seguir trabajando sin tantos altibajos de rendimiento. Esto es el
llamado buffer de datos. Un buffer puede ser muy variado en tamaño y en función,
pero siempre será una memoria que actúa de intermediaria entre un elemento que
da una información y otro que la recibe.
Aunque este sería el resumen simple, lo cierto es que existen muchos tipos
distintos de buffers y de métodos, pero en casi todos los casos el objetivo es
liberar al dispositivo principal de datos para permitirle seguir funcionando
óptimamente. Son de especial importancia en la comunicación entre dispositivos
(o funciones dentro de un mismo dispositivo) que requieren distintos tiempos para
ejecutarse.
La primera vez en la que se habló del termino Buffer fue en el año 1952, por
Russel A. Kirsch.
Algunos de los problemas más comunes que se dan son el desbordamiento, esto
pasa cuando el tamaño del Buffer es demasiado pequeño para almacenar toda la
información, subdesbordamiento, que es el problema ocasionado por la falta de
datos requeridos por el otro programa.
¿QUÉ ES LA MEMORIA CACHÉ?
En informática, se conoce como memoria caché o memoria de acceso rápido a

uno de los recursos con los que cuenta una CPU (Central Processing Unit, o sea,
Unidad Central de Procesamiento) para almacenar temporalmente los datos
recientemente procesados en un búfer especial, es decir, en una memoria auxiliar.
La memoria caché opera de modo similar a la Memoria Principal del CPU, pero

con mayor velocidad a pesar de ser de mucho menor tamaño. Su eficacia provee
al microprocesador de tiempo extra para acceder a los datos más frecuentemente utilizados,
sin tener que rastrearlos a su lugar de origen cada vez que sean necesarios.
Así, esta memoria alterna se sitúa entre el CPU y la Memoria

RAM (Random Access Memory, o sea, Memoria de Acceso Aleatorio), y provee de
un empuje adicional en tiempo y ahorro de recursos al sistema. De allí su nombre,
que en inglés significa “escondite”.
Existen varios tipos de memoria caché, como los siguientes:
Caché de disco. Es una porción de memoria RAM asociada a un disco particular,

en donde se almacenan los datos de reciente acceso para agilizar su carga.
Caché de pista. Similar a la RAM, este tipo de memoria caché sólida empleada por
supercomputadores es potente, pero costosa.
Caché de Web. Se ocupa de almacenar los datos de las páginas

Web recientemente visitadas, para agilizar su carga sucesiva y ahorrar ancho de
banda. Este tipo de caché a su vez puede funcionar para un solo usuario
(privada), varios usuarios a la vez (compartida) o en conjunto para toda la red
administrada por un servidor (en pasarela).
¿CÓMO FUNCIONA LA MEMORIA CACHÉ?
La memoria caché permite acceder a una copia de datos y no a los originales.
El funcionamiento de esta memoria alterna es simple: cuando accedemos a un

dato cualquiera en nuestro sistema computarizado, se crea de inmediato una
copia de los datos más relevantes del mismo en la memoria caché, de modo que
los accesos siguientes a dicha información la tengan a mano y no deban rastrearla
hacia su lugar de origen.
Así, accediendo a la copia y no al original, se ahorra tiempo de procesamiento

y por ende velocidad, ya que el microprocesador no debe acudir todo el tiempo a
la memoria principal. Se trata, digámoslo así, de una copia de trabajo constantemente
actualizada de los datos de más frecuente utilización.
¿QUE ES UNA BASE DE DATOS DISTRIBUIDA?
una Base de Datos Distribuida es una colección de datos que pertenecen

lógicamente a un solo sistema, pero se encuentra físicamente distribuido en varios
computadores o servidores de datos en una red de computadoras. Un sistema de
bases de datos distribuidas se compone de un conjunto de sitios lógicos,
conectados entre sí, mediante algún tipo de red de comunicaciones, en el cual:
Cada sitio lógico puede tener un sistema de base de datos.
Los sitios han sido diseñados para trabajar en conjunto, con el fin de que un
usuario de cualquier posición geográfica pueda obtener acceso a los datos desde
cualquier punto de la red tal como si todos los datos estuvieran almacenados en la
posición propia del usuario. Entonces, la llamada "Base de Datos Distribuida" es
en realidad una especie de “objeto virtual”, cuyos componentes se almacenan
físicamente en varias “bases de datos reales” ubicadas en diferentes sitios. En
esencia es la unión lógica de esas diferentes bases de datos.
En otras palabras, cada sitio tiene sus propias “bases de datos reales" locales, sus
propios usuarios locales, sus propios SGBD y programas para la administración de
transacciones y su propio administrador de comunicación de datos. Así pues, el
sistema de bases de datos distribuidas puede considerarse como una especie de
sociedad entre los diferentes SGBD individuales locales. Un nuevo componente de
software en cada sitio realiza las funciones de sociedad necesarias; y es la
combinación de este nuevo componente y el SGBD ya existente constituyen el
llamado Sistema de Administración o Gestión de Bases de Datos Distribuidas -
SGBDD. (En ingles DDBMS, Distributed DataBase Management System).
Desde el punto de vista del usuario final, un sistema distribuido deberá ser idéntico
a un sistema no distribuido. Los usuarios de un sistema distribuido se comportan
en su manipulación de información exactamente como si el sistema no estuviera
distribuido. Todos los problemas de los sistemas distribuidos son de tipo interno o
a nivel de realización, no pueden existir problemas de tipo externo o a nivel del
usuario final.
Los datos que se encuentran distribuidos en varios sitios y que están

interconectados por una red de comunicaciones tienen capacidad de
procesamiento autónomo de transacciones y hacer procesos locales. Cada sitio
realiza la ejecución de al menos una transacción global, la cual requiere accesos a
datos en diversos sitios.
¿QUE ES OLTP Y OLAP?
OLTP y OLAP son los dos sistemas de tratamiento transacciones online. OLTP es

un procesamiento transaccional mientras que OLAP es un sistema de
procesamiento analítico.
OLTP es un sistema que gestiona aplicaciones orientadas a transacciones en

Internet, por ejemplo, ATM. OLAP es un sistema en línea que reporta a consultas
analíticas multidimensionales como informes financieros, pronósticos, etc. La
diferencia básica entre OLTP y OLAP es que OLTP es un sistema de modificación
de base de datos online, mientras que OLAP es un sistema de respuesta de
consulta de base de datos online.
Principales diferencias
 El punto que distingue a OLTP y OLAP es que OLTP es un sistema de
transacciones en línea, mientras que OLAP es un sistema de recuperación
y análisis de datos en línea.
 Los datos transaccionales en línea se convierten en la fuente de datos para

OLTP. Sin embargo, la base de datos OLTPs diferente se convierte en la
fuente de datos para OLAP.
 Las operaciones principales de OLTP son insertar, actualizar y eliminar,

mientras que la operación principal de OLAP es extraer datos
multidimensionales para su análisis.
 OLTP tiene transacciones cortas pero frecuentes, mientras que OLAP tiene
transacciones largas y menos frecuentes.
 El tiempo de procesamiento para la transacción OLTPs es mayor en

comparación con OLAP.
 Las consultas OLAPs son más complejas con respecto a los OLTPs.
 Las tablas de la base de datos OLTP deben estar normalizadas (3NF),

mientras que las tablas de la base de datos OLAP pueden no estar
normalizadas.
 Como los OLTPs frecuentemente ejecutan transacciones en la base de

datos, en caso de que cualquier transacción falle en el medio puede dañar
la integridad de los datos y por lo tanto debe cuidar la integridad de los
datos. Mientras que en OLAP la transacción es menos frecuente, por lo
tanto, no se preocupa mucho por la integridad de los datos.
BASES DE DATOS RELACIONALES Y NO RELACIONALES
BASE DE DATOS NO RELACIONAL
es aquella que no usa el esquema tabular de filas y columnas que se encuentra en

la mayoría de los sistemas de base de datos más tradicionales. En su lugar, las
bases de datos no relacionales usan un modelo de almacenamiento que está
optimizado para los requisitos específicos del tipo de datos que se almacena. Por
ejemplo, los datos se pueden almacenar como pares clave/valor simple, como
documentos JSON o como un grafo que consta de bordes y vértices.
Lo que todos lo que estos almacenes de datos tienen en común están que no
utilizan un modelo relacional. Además, tienden a ser más específicos en el tipo de
datos que admiten y en cómo se pueden consultar los datos. Por ejemplo, los
almacenes de datos de serie temporal tiempo se optimizan para las consultas en
secuencias de datos basadas en tiempo, mientras que los almacenes de datos de
grafos se optimizan optimizados para explorar las relaciones ponderadas entre
entidades. Ninguno de los formatos se generalizaría bien en la tarea de
administrar datos transaccionales.
El término NoSQL hace referencia a los almacenes de datos que no usan SQL

para las consultas, en su lugar, usan otros lenguajes de programación y
construcciones para consultar los datos. En la práctica, "NoSQL" significa "base de
datos no relacional", aunque muchas de estas bases de datos admiten consultas
compatibles con SQL. Sin embargo, la estrategia de ejecución de consultas
subyacente normalmente es de la forma en que una RDBMS tradicional ejecutaría
la misma consulta SQL.
Ventajas
Versatilidad: La principal ventaja por la cual esta nueva tecnología difiere de las
demás soluciones de bases de datos es la versatilidad que ofrece a crecimientos o
cambios sobre la forma como almacena la información, si fuera necesario agregar
un nuevo campo sobre una “colección” (en base de datos relacional se definen
tablas), dado que se basa sobre una notación ligera de intercambio de
documentos baso en notación JSON(Java Script Object Notation), simplemente se
agregan sobre el documento y el sistema sigue operando sin agregar
configuraciones extras.
Crecimiento Horizontal: Soportan una escalabilidad descentralizada, es decir,

soportan estructuras distribuidas, si durante la operación se ve que los
desempeños de los servidores tienden a bajar, se instalan nuevos nodos
operativos para que balanceen la carga de trabajo, a esto le llaman crecimiento
horizontal.
¿Disponibilidad de Recursos: ¿No se requieren servidores con una gran cantidad

de recursos disponibles para operar, pueden empezar a operar con bajos recursos
e ir creciendo dependiendo de las necesidades sin tener que detener los servicios
de operación?
Optimización: Los sistemas NoSQL tienen un algoritmo interno para reescribir las
consultas escritas por los usuarios o las aplicaciones programadas, esto con el fin
de no sobrecargar el rendimiento de los servidores y mantener un nivel óptimo en
las operaciones.
Desventajas
Atomicidad: No todas las bases de datos contienen la característica de la

atomicidad en la información, esto quiere decir, que la información en ocasiones
no es consistente, puede ser diferente en cada uno de los nodos replicas que se
puedan configurar en la arquitectura de base de datos.
Documentación del Software: Dado que NoSQL, es relativamente nuevo, las

operaciones pueden ser limitadas y se requiera de conocimientos avanzados con
el uso de la herramienta y las personas que se encuentran realizando estos
desarrollos en el software tengan que invertir más tiempo en los desarrollos.
Estándares en el lenguaje: No se tiene un estándar definido entre los diferentes

motores que ofrecen este servicio, es decir, por ejemplo: DB2 para poder insertar
información sobre su base de datos, el manejo de los objetos JSON no es el
mismo como se utiliza en MondosDB y con ellos la diversidad de conocimientos
que se tiene que tener dependiendo de la solución NoSQL se vaya a utilizar.
Herramientas GUI (Graphical User Interface): Las herramientas que ofrecen para
la administración de estas herramientas, suelen tener acceso por consola, no
tienen una interfaz gráfica, se requiere conocimiento amplio de las instrucciones a
utilizar para su mantenimiento.
RELACIONAL
Una base de datos relacional es una recopilación de elementos de datos con

relaciones predefinidas entre ellos. Estos elementos se organizan como un
conjunto de tablas con columnas y filas. Las tablas se utilizan para guardar
información sobre los objetos que se van a representar en la base de datos. Cada
columna de una tabla guarda un determinado tipo de datos y un campo almacena
el valor real de un atributo. Las filas de la tabla representan una recopilación de
valores relacionados de un objeto o entidad. Cada fila de una tabla podría
marcarse con un identificador único denominado clave principal, mientras que filas
de varias tablas pueden relacionarse con claves extranjeras. Se puede obtener
acceso a estos datos de muchas formas distintas sin reorganizar las propias tablas
de la base de datos.
Ventajas y Desventajas
Ventajas
Provee herramientas que garantizan evitar la duplicidad de registros.
Garantiza la integridad referencial, así, al eliminar un registro elimina todos los

registros relacionados dependientes.
Favorece la normalización por ser más comprensible y aplicable.
Desventajas
Presentan deficiencias con datos gráficos, multimedia, CAD y sistemas de
información geográfica.
No se manipulan de forma manejable los bloques de texto como tipo de dato.
¿QUÉ ES UN GESTOR DE BASE DE DATOS?
Un sistema gestor de bases de datos (SGBD) es un software del sistema para

crear y administrar bases de datos. Esta solución brinda a los usuarios y
programadores una forma sistemática de crear, recuperar, actualizar y administrar
su información. De acuerdo con esto, es la forma más efectiva para detectar
duplicados y garantizar la calidad de los datos.
Además, permite a los usuarios finales crear, leer, actualizar y eliminar información
en una base de datos. También sirve como una interfaz entre la base de datos y
los usuarios finales o los programas de aplicación; asegurando que los datos
estén organizados de manera consistente y fácilmente accesibles.
FUNCIONES DEL SISTEMA
El SGBD controla tres elementos vitales: la información, los motores de bases de datos

que permiten el acceso, bloqueo y modificación de información, y los esquemas de base
de datos, que definen las estructuras lógicas de las bases de datos. Elementos que son
imprescindibles para poder asegurar la seguridad e integridad de los datos, así como la
uniformidad en los procedimientos de administración.
De esta manera, las funciones típicas de administración de bases de datos admitidas por
el SGBD incluyen la administración de cambios, la monitorización y la recuperación.
Muchos sistemas de gestión de bases de datos también son responsables de las
restituciones, reinicios y rescates mecanizados, así como del análisis y control de
actividad.
Por lo tanto, puede ofrecer independencia lógica y física de los datos. Eso significa que es
capaz de proteger a los usuarios y aplicaciones de la necesidad de saber dónde se
almacenan los datos o tener que preocuparse por los cambios en la estructura física de
los datos, almacenamiento y hardware).
CONLCUSIONES:
Un sistema de gestión de base de datos ( DBMS), es una agrupación de

programas que se encargan de manejar la creación y todos los accesos a las
bases de datos y de igual forma funciona y sirve de interfaz o como elemento de
enlace entre el usuario y la base de dato. Los beneficios que ofrece a una
empresa el uso del DBMS son:
• Permite a la empresa mantener de forma íntegra y segura los diferentes datos
que son confidenciales y vitales para la organización, y así evitar el fácil acceso a
personas que no estén autorizadas para el manejo de esta.
• Mediante el uso del DBMS, una empresa le permite crear base de dato con el fin
de mantener toda su Informacion o archivos de forma organizada; es decir, facilita
al usuario obtener datos de forma rápida.
• Bajan drásticamente los tiempos de desarrollo y aumentan la calidad del sistema,

siempre y cuando sean bien utilizados por los encargados de manejar la
información dentro de la empresa.
REFERENCIAS:
(MARTINEZ, 2010)
(http://ley55.blogspot.com, 2014)
(C, 2015)
(Ros, 2019)
(tecnologicon, 2015)
(https://concepto.de/memoria-cache/)
(http://froac.manizales.unal.edu.co)
(https://pc-solucion.es/2018/04/23/diferencias-entre-oltp-y-olap/)
(https://aukera.es/)
(https://aws.amazon.com)
(microsoft, 2018)
(http://sergioyrafael-informatica.blogspot.com, 2011)
(https://medium.com/@marlonmanzo, 2016)
(https://deyde.es)
(https://blog.powerdata.es, 2015)

PP A1 Miguel - Morenobd

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PP A1 Miguel - Morenobd

Cargado por

Copyright:

Formatos disponibles

NOMBRE DE LA INSTITUCIÓN: U NIVERSIDAD L ATINOAMERICANA

PROGRAMA: L ICENCIATURA EN I NGENIERÍA EN R EDES Y N UEVAS T ECNOLOGÍAS

CLAVE Y NOMBRE DE LA MATERIA : IEB-713-580-BASES DE DATOS I

NOMBRE DEL ENTREGABLE: “ARQUITECTURA DBMS”

NOMBRE DEL FACILITADOR: PSAUMIS ESCOBEDO DELGADO

NOMBRE DEL ESTUDIANTE: E DUARDO M IGUEL M ORENO

Un sistema manejador de bases de datos (SGBD, por sus siglas en inglés)

Como su propio nombre indica, el objetivo de los sistemas manejadores de base

Lo hace mediante una serie de rutinas de software que permiten su uso de una

Su uso permite realizar un mejor control a los administradores de sistemas y, por

A continuación, se describe cómo es su arquitectura. Podemos ver sus

Un sistema gestor de bases de datos (SGBD) es una colección de datos

COMPONENTES DE UN SISTEMA GESTOR DE BASES DE DATOS

Obervamos en la parte inferior del diagrama aparecen los datos en sí,

Luego observamos una serie de programas. El primer grupo de programas se

El gestor de memoria intermedia atiende solicitudes de consultas que involucran

El gestor de transacciones gestiona la ejecución de las transacciones o

El gestor de archivos gestiona la asignación de espacio de almacenamiento en

El otro grupo de programas se encarga de las consultas. Allí podemos observar

LDD = Lenguaje de Definición de Datos.

LMD = Lenguaje de manipulación de datos.

Los usuarios normales son usuarios que no requieren preparación especial en el

Los usuarios sofisticados son quienes utilizan la base de datos a través de

¿Y el Administrador de Bases de Datos? Entre sus tareas se encuentran las

 Crear el esquema de la base de datos, es decir el diseño lógico de la B.D.

¿QUE SON LOS ARREGLOS RAID?

Tenemos un conjunto de cuatro siglas que significan «conjunto redundante de

Este tipo de configuración se distribuyen los datos de forma equilibrada entre

Una ventaja importante, pero por desgracia también presenta un gran

Cuando utilizamos una configuración RAID 1 los datos de cada unidad de

Aunque el objetivo principal de esta configuración es asegurar la integridad de

El uso de configuraciones RAID no es algo nuevo, y tampoco es exclusivo del

Pero no solo ha influido el precio de las unidades de almacenamiento, la

En líneas generales estamos ante una configuración idéntica a una RAID 5, con la

Otro problema que presenta esta configuración es la capacidad real de

Definición de Buffer. Es el espacio de la memoria en un disco duro o en un

¿CÓMO FUNCIONA EL BUFFER?

¿QUÉ ES LA MEMORIA CACHÉ?

En informática, se conoce como memoria caché o memoria de acceso rápido a

La memoria caché opera de modo similar a la Memoria Principal del CPU, pero

Así, esta memoria alterna se sitúa entre el CPU y la Memoria

Existen varios tipos de memoria caché, como los siguientes:

Caché de disco. Es una porción de memoria RAM asociada a un disco particular,

Caché de Web. Se ocupa de almacenar los datos de las páginas

La memoria caché permite acceder a una copia de datos y no a los originales.

El funcionamiento de esta memoria alterna es simple: cuando accedemos a un

Así, accediendo a la copia y no al original, se ahorra tiempo de procesamiento

¿QUE ES UNA BASE DE DATOS DISTRIBUIDA?

una Base de Datos Distribuida es una colección de datos que pertenecen

Cada sitio lógico puede tener un sistema de base de datos.

Los datos que se encuentran distribuidos en varios sitios y que están

OLTP y OLAP son los dos sistemas de tratamiento transacciones online. OLTP es

OLTP es un sistema que gestiona aplicaciones orientadas a transacciones en

 Los datos transaccionales en línea se convierten en la fuente de datos para

 Las operaciones principales de OLTP son insertar, actualizar y eliminar,

 El tiempo de procesamiento para la transacción OLTPs es mayor en

 Las tablas de la base de datos OLTP deben estar normalizadas (3NF),

 Como los OLTPs frecuentemente ejecutan transacciones en la base de

BASE DE DATOS NO RELACIONAL

es aquella que no usa el esquema tabular de filas y columnas que se encuentra en

El término NoSQL hace referencia a los almacenes de datos que no usan SQL

Crecimiento Horizontal: Soportan una escalabilidad descentralizada, es decir,

¿Disponibilidad de Recursos: ¿No se requieren servidores con una gran cantidad