Está en la página 1de 11

Unidad 2 / Escenario 3

Lectura fundamental

Modelos de datos y marco


conceptual de una base de datos

Contenido

1 Modelos de datos y marco conceptual de una base de datos

Palabras clave: modelos de datos, bases de datos relacionales, bases de datos no relacionales, lenguajes de bases de
datos, sistema gestor de bases de datos.
1. Modelos de datos y marco conceptual de una base de datos

1.1. Modelos de datos

Un modelo de datos corresponde a la estructura lógica asociada con la documentación y organización


de la información, junto con las relaciones y restricciones de acceso y almacenaje de dicha
información. Estos modelos de datos pueden elegirse dependiendo de la etapa de diseño en la que se
encuentre el sistema de información, del tipo de datos a manejar y de la naturaleza de las relaciones
entre datos:

• Modelos relacionales: este modelo se basa en el ordenamiento de datos en tablas, conocidas como
relaciones y organizadas en columnas y filas. Cada columna representa un atributo de la entidad que
se almacena en cada tabla y cada fila incluye los datos sobre una instancia en especial de la entidad
asociada. Por ejemplo, si una tabla incluye la información sobre clientes (la entidad asociada con
esta tabla), una de las columnas de esta tabla puede almacenar el atributo número de cédula, y cada
fila contendrá los datos de un cliente en especial (una instancia específica de la entidad cliente).
Un atributo en particular o un conjunto de atributos serán elegidos como clave primaria, para hacer
mención de cualquier instancia de la entidad en otras tablas. Adicionalmente, los modelos relacionales
describen los tipos de relaciones entre entidades. Estas relaciones pueden ser uno a uno, uno a
muchos y muchos a muchos.

• Modelos jerárquicos: los modelos jerárquicos clasifican los datos en una estructura tipo árbol,
en la cual cada registro está enlazado en forma de nodo. Un nodo padre de información puede
estar asociado con uno o varios nodos hijo. Este tipo de modelos permite representar fácilmente
relaciones del tipo uno a varios, donde varios nodos hoja se relacionan con el nodo raíz. Sin
embargo, no existen índices que simplifiquen la labor de realizar búsquedas desde el nodo raíz
hacia los nodos hoja.

• Modelos de red: es una variación del modelo de datos jerárquico, en el cual se permiten las
relaciones de muchos a muchos, a través de la teoría matemática de conjuntos. En este modelo
cada conjunto tiene un registro principal o propietario y uno o más registros secundarios. La
mayor ventaja de este modelo es que permite que un registro sea secundario en más de un
conjunto a la vez, lo que facilita el modelaje de relaciones complejas.

POLITÉCNICO GRANCOLOMBIANO 2
• Modelos de bases de datos orientados a objetos: esta clase de modelos plantea que la base
de datos de la organización está conformada por una colección de objetos con funciones y
métodos relacionados. Entre los modelos orientados a objetos puede incluirse una base de
datos de imágenes o videos con palabras clave y otros atributos, que no podrían almacenarse
apropiadamente en una base de datos.En sistemas de información en los que se tenga un
conjunto de objetos disímiles, pero que se deseen conectar entre sí, se puede manejar una base
de datos con hipervínculos o hipertexto. Cabe anotar que este tipo de bases de datos no es muy
útil para realizar un análisis cuantitativo de la información.

• Modelos entidad-relación: cuando el equipo de trabajo que está encargado de implementar


el sistema de información se encuentra en la etapa de diseño, se puede representar
conceptualmente la estructura de las entidades, atributos y relaciones a través de un diagrama
entidad-relación.

• Modelo de estrella: es un tipo particular de modelo entidad-relación, en el cual una tabla


principal se presenta en el centro de un diagrama y se muestra la relación de dicha tabla con
otras tablas secundarias.

Cabe anotar que de acuerdo con el American National Standards Institute (ANSI) todo modelo de
datos puede enmarcarse en alguno de los siguientes esquemas:

• Conceptual: aquel que describe las definiciones, reglas y términos que se utilizarán para
estructurar al modelo.

• Lógico: aquel que detalla la semántica con la cual se manipularán los diferentes objetos del
modelo, sus relaciones y propiedades.

• Físico: aquel que describe los medios en los que se almacenará la información.

Un sistema gestor de bases de datos (SGBD) está conformado por la colección de datos organizados
con base en el modelo de datos planteado (base de datos), así como el conjunto de programas para
acceder a dichos datos. La función principal del sistema gestor de bases de datos es facilitar de forma
práctica el almacenamiento y consulta de información.

POLITÉCNICO GRANCOLOMBIANO 3
Esta gestión incluye la definición de estructuras de almacenamiento de datos y la implementación
de mecanismos de manipulación, procesamiento y consulta de dichos datos para convertirlos en
información relevante.

1.1.1. Arquitectura de un sistema gestor de bases de datos

Generalmente, las aplicaciones gestoras de bases de datos permiten que las máquinas-cliente en las
que los usuarios realizan sus consultas se conecten a las máquinas-servidor en las que está alojado el
sistema de la base de datos. Dependiendo de la complejidad de la base de datos, esta se puede diseñar
con una arquitectura de dos o tres capas:

Arquitectura de Arquitectura de
dos capas tres capas

Cliente Cliente

Usuario Usuario

Aplicación Cliente de
aplicaciónes

Red
Red

Servidor

Servidor de
Sistema de
aplicaciones
base de datos

Servidor

Sistema de
base de datos

Figura 1. Arquitectura de un sistema gestor de bases de datos


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 4
1.1.2. Funciones de un sistema gestor de bases de datos

El propósito esencial de un SGBD es el de administrar de forma sencilla, ordenada y clara la


información residente en la base de datos, a través del cumplimiento de las siguientes funciones:

• Consultas no predefinidas: se refiere a la capacidad del SGBD para atender consultas de los
usuarios independientemente del nivel de complejidad, sin que se requiera escribir, compilar y
ejecutar código específico para realizar cada consulta.

• Independencia: corresponde a la posibilidad de que diversos usuarios tengan diferentes visiones


sobre la estructura lógica de una misma base de datos. Dichas visiones son independientes entre
sí e independientes de la base de datos.

• Flexibilidad: corresponde a la capacidad de alterar el esquema de la base de datos sin que se


deban realizar cambios en las aplicaciones que se utilizan para consultarla.

• Redundancia: el SGBD debe minimizar la redundancia de datos. Un conjunto de datos maestros


debería estar alojado en una única ubicación al interior de la base de datos.

• Consistencia: si existe cierto nivel de redundancia de datos, el SGBD debe velar por que la
información repetida se actualice de manera coherente, con una actualización simultánea
de dichos datos. Adicionalmente, la consistencia se refiere al cumplimiento de las reglas
dispuestas para la incorporación de la información que conforma la base de datos. Por ejemplo,
si se establece que un dato obligatorio para crear un nuevo cliente en la base de datos es un
NIT de 9 dígitos más un digito adicional de verificación, el sistema gestor de bases de datos
no debe permitir que se cree un cliente sin ingresar su NIT, o si no se agregan los 10 dígitos
correspondientes.

• Integridad de datos: se refiere a la serie de reglas o restricciones que deben incluirse en la


SGBD para asegurarse de que los datos que se incorporen al sistema sean consistentes. Dichas
reglas deben evitar que un usuario realice una operación que vaya en contra de las reglas que se
definieron al crear la base de datos.

• Restauración de datos: todo SGBD debe contar con mecanismos para reconstruir la base de
datos si ocurre un incidente. Procesos como la generación de back-ups o copias de seguridad y
el registro de modificaciones (logs) permiten realizar la restauración de la base de datos.

• Concurrencia de usuarios: la base de datos debe estar configurada de forma que varios usuarios
puedan acceder de forma simultánea y realizar consultas y modificaciones.

POLITÉCNICO GRANCOLOMBIANO 5
• Gestión de interferencia entre transacciones: el SGBD debe contar con reglas que eviten
que se presenten problemas de interferencia si dos usuarios intentan modificar el mismo dato.
Adicionalmente, si una operación que realiza un usuario afecta un conjunto de datos, la base
de datos debe realizar todo el conjunto de modificaciones (vistas como una transacción) o no
realizar ninguna.

• Seguridad: consiste en la capacidad de validar las autorizaciones y derechos de acceso para consulta
y/o modificación de datos a diferentes usuarios y roles dentro de la base de datos, tanto a nivel global
como a nivel entidad o atributo. Por ejemplo, un usuario con el rol de cajero no podría modificar
manualmente la capacidad de crédito de un cliente, pero sí podría consultarla.

1.1.3. Modelos de datos relacionales

Para poder acceder a la información que proviene del mundo real de forma clara, consistente y
comprensible en una base de datos, debe diseñarse una representación de dicha realidad a través de
un modelo que involucre a las entidades que conforman al sistema real. El modelo más conocido en
la actualidad es el modelo relacional, el cual permite administrar los datos dinámicamente a través de
una serie de reglas de integridad para definir las relaciones entre entidades.

El modelo relacional fue planteado originalmente por Edgar F. Codd (IBM – 1970). Este modelo
cuenta con 3 componentes principales:

• Estructura de datos a través de entidades y relaciones: es la asociación de las entidades que


conforman la base de datos a través de sus atributos. Una entidad es una clase o conjunto de
objetos que se pueden identificar claramente en el sistema real a representar. Estos conjuntos
de objetos se organizan en tablas relacionadas entre sí.

• Reglas para garantizar la integridad de la información.

• Un conjunto de operadores asociados.

El diseño de un modelo relacional tiene como fundamento las relaciones naturales que existen entre
cada entidad y los elementos o entidades de su entorno. El modelo relacional representa entidades
como matrices rectangulares (tablas) compuestas por registros (filas de la tabla) y campos (columnas
de la tabla). Las relaciones entre entidades se representan como conexiones entre las distintas tablas
del modelo relacional, conformando lo que se conoce como un modelo entidad-relación.

POLITÉCNICO GRANCOLOMBIANO 6
Los principales elementos que permiten manipular, actualizar, buscar y compilar la información
contenida en una base de datos relacional son los siguientes:

1. Tablas: representan una entidad y los elementos que la conforman, a través de la siguiente
asociación: cada tabla corresponde a una entidad de interés e incluye un conjunto de elementos.
Cada uno de estos elementos es un registro de la tabla y corresponde a una fila de la misma.
Los valores para cada atributo o característica propia de una entidad se indican en los campos
(columnas) de dicha tabla.

2. Formularios: son las interfaces que se pueden utilizar para introducir los datos a las diferentes
tablas, para mostrarlos de forma amigable y para modificarlos con mayor facilidad. Facilitan la
actualización de la base de datos.

3. Consultas: sirven para filtrar datos y recuperarlos en función de un conjunto de criterios de


búsqueda. Dichos criterios pueden categorizarse.

4. Informes: se presentan de forma organizada y resumida las necesidades de información que


pueda requerir uno o más usuarios.

Una base de datos es una colección estructurada de datos que permite almacenarlos, clasificarlos
apropiadamente, consultarlos y transformarlos en información útil a través de reportes que apoyan la
toma de decisiones.

1.1.4. Bases de datos relacionales

Una base de datos relacional es aquella que se administra como un conjunto de tablas bajo el esquema
de modelo relacional. En un modelo relacional la información se almacena en tablas interconectadas
entre sí a través de relaciones. Sus principales características son las siguientes:

• La base de datos se compone de tablas y relaciones.

• Toda tabla está compuesta por registros y campos.

• Cada registro en una tabla se identifica por su clave primaria y cumplen con las condiciones de
integridad de datos.

• No pueden existir dos tablas con la misma denominación.

POLITÉCNICO GRANCOLOMBIANO 7
• Las relaciones entre tablas se establecen a partir de las claves primarias que figuran en la tabla
padre y las claves foráneas que aparecen en la tabla hija.

• Un cambio en la base de datos implica la comunicación de dicho cambio a todos los nodos que
lo repliquen.

El modelo relacional permite interactuar de forma sencilla con los datos a través de tablas y realizar
consultas que incluyan información contenida en varias tablas. Además, permiten mantener la
integridad de las relaciones: por ejemplo, una tabla hija no puede tener un dato de un registro padre
inexistente, así como tampoco pueden existir registros con la llave primaria repetida en la tabla padre.

Las bases de datos relacionales son costosas en términos de rendimiento a causa de las condiciones
que deben revisarse para garantizar la integridad de datos. Por otra parte, estas bases de datos tienen
una estructura que no es propicia para realizar muchas modificaciones a la estructura original de la
base diseñada. Constantes cambios en la estructura de una base de datos inicialmente pequeña la
pueden hacer crecer en tiempos de procesamiento y espacio requerido para almacenamiento.

1.1.5. Bases de datos no relacionales

Este tipo de bases de datos, que no cumplen con las reglas de un modelo relacional, se conocen como
bases de datos NoSQL (Not Only SQL). Este término se aplica desde 2009 a las bases de datos
distribuidas de código abierto no relacionales gracias al aporte de Johan Oskarsson, quien adaptó
la expresión originaria de 1998 y que solo se limitaba a bases de datos que no usaban el lenguaje de
consultas SQL (Structured Query Language).

Toda base de datos no relacional se caracteriza por lo siguiente:

• Los cambios en la base de datos no necesariamente deben replicarse a todos los nodos
asociados con los datos involucrados. Esta flexibilidad en los mecanismos de consistencia hace
que las bases de datos no relacionales tengan lo que se conoce como coherencia eventual
flexible básicamente disponible (BASE – Basically Available Soft-State Eventual Consistency).

• Los datos se encuentran con una estructura distribuida en tablas DHT (Tablas de Hash Distribuidas).

• Son bases de datos con tolerancia a fallos y redundancia.

POLITÉCNICO GRANCOLOMBIANO 8
Cabe aclarar que, aunque las bases de datos NoSQL siguen manejando el modelo
de entidad-relación.

Las bases de datos no relacionales son útiles cuando los datos que se manejan varían mucho en poco
tiempo en su estructura, ya que este tipo de BD permite agregar campos de forma libre sin tener que
definir una estructura. Adicionalmente, una consulta en una BD no relacional maneja todos los datos.

1.2. Lenguajes de bases de datos

Al implementar un sistema gestor de bases de datos que represente apropiadamente el modelo de


datos diseñado para la organización, se suelen utilizar dos lenguajes para la creación de la base de
datos y para su manipulación. Estos lenguajes son:

1. Lenguaje de Definición de Datos (LDD): es el que se utiliza para especificar las definiciones del
esquema de la base de datos, para la creación de tablas y la carga inicial de datos. Con base en
dicho lenguaje se crea el diccionario de datos y se carga la información inicial que conforma la
base de datos. Esta carga de información se realiza con un conjunto particular de instrucciones
del LDD llamado lenguaje de almacenamiento y definición de datos.

2. Lenguaje de Manipulación de Datos (LMD): es el lenguaje utilizado para permitirles a los


usuarios el acceso y la manipulación de datos que se encuentran en la base de datos. Este
lenguaje se utiliza para formular instrucciones con los siguientes fines:

A. Recuperar información almacenada en la base de datos.

B. Insertar información nueva.

C. Borrar información existente.

D. Modificar información existente.

Los LMD se clasifican en LMD procedimentales y LMD declarativos. Mientras los LMD
procedimentales requieren que el usuario indique la forma como se obtendrán los datos, los LMD
declarativos no necesitan que el usuario indique la forma como se obtendrán los datos, solamente
deben indicar qué datos necesitan consultar.

El componente del LMD que se encarga de la recuperación de información se conoce como lenguaje
de consultas.

POLITÉCNICO GRANCOLOMBIANO 9
Referencias
Filip, F. G. (2007). Management Information Systems: Managing the Digital Firm (Book Review).
International Journal of Computers Communications & Control, 2 (1), 103-105.

Guerrero, H. (2010). Excel Data Analysis, Modeling and Simulation. New York: Springer.

Heijden, H. (2009). Designing Management Information Systems. New York, USA: Oxford University
Press.

Lache, L., León, A., Bravo, E., Becerra, L. y Forero, D. (2016). Las tecnologías de información y
comunicación como prácticas de referencia en la gestión de conocimiento: una revisión sistemática de la
literatura. Revista UIS Ingenierías, 15 (1), 27-40.

Oz, E. (2009). Management Information Systems (6.a ed.). Pennsylvania, USA: Thomson Course
Technology.

POLITÉCNICO GRANCOLOMBIANO 10
INFORMACIÓN TÉCNICA

Módulo: Gestión de la Información


Unidad 2: Introducción a las bases de datos
Escenario 3: Modelos de datos y marco conceptual de una
base de datos

Autor: Oscar Javier Parra Ortega

Asesor Pedagógico: Luisa Esperanza Rincón Jiménez


Diseñador Gráfico: Cristian Navarro
Asistente: Ginna Quiroga

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 11

También podría gustarte