Está en la página 1de 54

1.

1 Conceptos Básicos

Una base de datos es un conjunto de información


organizada de manera que pueda ser utilizada
eficientemente. Un directorio telefónico, un diccionario, un
calendario o un libro de recetas son ejemplos de bases de
datos.
La información en una base está organizada en forma de registros.
Cada registro contiene toda la información sobre una persona o un
elemento de la base. Por ejemplo, cada registro en el directorio
telefónico contiene el nombre, dirección y número telefónico de una
persona.

Cada registro contiene campos. Un campo se utiliza para almacenar


una información particular. Por ejemplo, en el directorio telefónico un
campo almacena el nombre, otro campo almacena la dirección y otro
campo almacena el número telefónico de la persona. Cada registro
contiene cada uno de estos campos y cada registro puede tener
información en esos campos.
El nombre de un campo generalmente identifica la información almacenada en el campo.

Por ejemplo, los campos pueden llamarse Nombre, Dirección o Número telefónico.

Cada campo tiene un tipo que identifica la clase de información que puede almacenar:
números, fechas, caracteres alfanuméricos y otros.

Como cada campo contiene un tipo específico de datos, usted puede realizar cálculos y otras
operaciones con la información guardada en ellos. Por ejemplo, puede sumar los números
de dos campos. Puede comparar la fecha de un campo con la de otro. Puede mostrar el
nombre de una persona (almacenado en un campo) después de su apellido (almacenado en
otro campo) para construir la primera línea de una etiqueta de correo.
El conjunto de registros que utilizan los mismos campos conforma una tabla.

Una base de datos puede contener muchas tablas


1.2 Objetivos de las BD
1. Independencia lógica y física de los datos.
Se refiere a la capacidad de modificar una definición de esquema en un nivel de la arquitectura sin que esta
modificación afecte al nivel inmediatamente superior.
El conjunto de datos contenidos en la base debe ser única y estar integrada por los mismos datos.

2. Redundancia mínima.
Debe ser controlada, de forma que no exista duplicidad innecesarias, y que las redundancias físicas,
convenientes muchas veces a fin de responder a objetivos de eficiencia, sean tratadas por el mismo sistema, de
modo que no puedan producirse inconsistencias.
Se trata de usar la base de datos como repositorio común de datos para distintas aplicaciones.
Un dato se actualizará lógicamente por el usuario en forma única, y el sistema se preocupará de cambiar
físicamente todos aquellos campos en los que el dato estuviese repetido en caso de existir redundancia física
(redundancia controlada).
3. Acceso concurrente por parte de múltiples usuarios
Las bases de datos pretenden servir al conjunto de la organización,
manejando los datos como otro recurso. Por lo tanto, las bases de
datos han de atender a múltiples usuarios y a diferentes
aplicaciones. En contraposición a los sistemas de ficheros, en donde
cada fichero atiende a determinada aplicación.

4. Distribución espacial de los datos.


Los datos pueden encontrarse en otra habitación, otro edificio e
incluso otro país, el usuario no tiene por qué preocuparse de la
localización espacial de los datos a los que accede.
5. Integridad de los datos.
Se refiere a las medidas de seguridad que impiden que se
introduzcan datos erróneos.
Esto puede suceder tanto por motivos físicos (defectos de
hardware, actualización incompleta debido a causas externas),
como de operación (introducción de datos incoherentes).

6. Consultas complejas optimizadas.


permite la rápida ejecución de las mismas.
7. Seguridad de acceso y auditoría.
Se refiere al derecho de acceso a los datos contenidos en la base por parte de personas y organismos.
El sistema de auditoría mantiene el control de acceso a la base, con el objeto de saber qué o quién realizó
una determinada modificación y en qué momento. Por ejemplo un profesor quiere cambiar una calificación
por alguna omisión, el sistema de la base le permitirá hacer el cambio pero quedara el registro del día y el
motivo del cambio, esto lo checan los jefes de academia y observan si el profesor le ayuda al alumno o
realizan su trabajo adecuadamente.

8. Respaldo y recuperación.

Se refiere a la capacidad de un sistema de base de datos de recuperar su estado en un momento previo a


la pérdida de datos.

9. Acceso a través de lenguajes de programación estándar.

Se refiere a la posibilidad ya mencionada de acceder a los datos de una base mediante lenguajes de
programación ajenos al sistema de base de datos. en pocas palabras son los programas o software con los
que se mandaran llamar y diseñar los datos que aparecerán en la pantalla
1.3 Áreas de aplicación de los sistemas de BD
Actualmente la base de datos se utilizan en todas las organizaciones tanto públicas como privadas
algunos ejemplos son:

Banca: información de clientes, cuentas, transacciones, préstamos, etc.

Líneas aéreas: información de clientes, horarios, vuelos, destinos, etc.

Universidades: información de estudiantes, carreras, horarios, materias, etc.

Transacciones de tarjeta de crédito: para comprar con tarjetas de crédito y la generación de los extractos
mensuales.

Telecomunicaciones: para guardar registros de llamadas realizadas, generar facturas mensuales, mantener el
saldo de las tarjetas, telefónicas de prepago y almacenar información sobre las redes.
1.4 Modelos de bases de datos
Qué es un modelo de base de datos

Un modelo de base de datos muestra la estructura lógica


de la base, incluidas las relaciones y limitaciones que
determinan cómo se almacenan los datos y cómo se
accede a ellos.

La mayoría de los modelos de datos se pueden representar por


medio de un diagrama de base de datos
Tipos de modelos de bases de datos
Hay muchos tipos de modelos de bases de datos. Algunos de los más comunes
incluyen:

 Modelo de base de datos jerárquico


 Modelo relacional
 Modelo de red
 Modelo de base de datos orientado a objetos
 Modelo entidad-relación
 Modelo de documentos
 Modelo entidad-atributo-valor
 Esquema de estrella
 Modelo relacional de objetos, que combina los dos que forman su nombre
1.5 Clasificación de las BD

Las bases de datos pueden clasificarse de varias


maneras, de acuerdo al contexto que se esté
manejando, la utilidad de las mismas o las necesidades
que satisfagan.
Según la variabilidad de la base de datos

Bases de datos estáticas


Son bases de datos únicamente de lectura, utilizadas primordialmente para
almacenar datos históricos que posteriormente se pueden utilizar para estudiar
el comportamiento de un conjunto de datos a través del tiempo, realizar
proyecciones, tomar decisiones y realizar análisis de datos para
inteligencia empresarial.
Bases de datos dinámicas
Son bases de datos donde la información almacenada se modifica con el
tiempo, permitiendo operaciones como actualización, borrado y edición de
datos, además de las operaciones fundamentales de consulta. Un ejemplo,
puede ser la base de datos utilizada en un sistema de información de un
supermercado.
Según el contenido
Bases de datos
Solo contienen un subrogante (representante) de la fuente primaria, que
permite localizarla. Un registro típico de una base de datos bibliográfica
contiene información sobre el autor, fecha de publicación, editorial, título,
edición, de una determinada publicación, etc. Puede contener un resumen o
extracto de la publicación original, pero nunca el texto completo, porque si no,
estaríamos en presencia de una base de datos a texto completo (o de fuentes
primarias). Como su nombre lo indica, el contenido son cifras o números. Por
ejemplo, una colección de resultados de análisis de laboratorio, entre otras.
Bases de datos de texto completo
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de
todas las ediciones de una colección de revistas científicas.
Directorios
Un ejemplo son las guías telefónicas en formato electrónico.
Estos directorios se pueden clasificar en dos grandes tipos dependiendo de si son personales o
empresariales (llamadas páginas blancas o amarillas respectivamente).
Los directorios empresariales hay de tres tipos
Tienen nombre de la empresa, dirección y teléfono
Los más avanzado contienen correo electrónico
Los últimos contienen datos como facturación o número de empleados además de códigos
nacionales que ayudan a su distinción

Los directorios personales solo hay de un tipo, ya que leyes como la LOPD en España protege la
privacidad de los usuarios pertenecientes al directorio
La búsqueda inversa está prohibida en los directorios personales (a partir de un número de teléfono
saber el titular de la línea)
Bases de datos o "bibliotecas" de información química o biológica

Son bases de datos que almacenan diferentes tipos de información proveniente


de la química, las ciencias de la vida o médicas. Se pueden considerar en
varios subtipos:
 Las que almacenan secuencias de nucleótidos o proteínas.
 Las bases de datos de rutas metabólicas.
 Bases de datos de estructura, comprende los registros de datos
experimentales sobre estructuras 3D de biomoléculas-
 Bases de datos clínicas.
 Bases de datos bibliográficas (biológicas, químicas, médicas y de otros
campos): PubChem, Medline, EBSCOhost.
Puedes elegir describir una base de datos con cualquiera de ellos
dependiendo de varios factores. El mayor factor es si el sistema de
gestión de bases de datos que estás usando es compatible con un
modelo en particular. La mayoría de los sistemas de gestión de
bases de datos están desarrollados con un modelo de datos
particular en mente y requieren que los usuarios adopten ese
modelo, aunque algunos son compatibles con múltiples modelos.
Modelo relacional

Siendo el modelo más común, el modelo relacional ordena los datos en


tablas, también conocidas como relaciones, cada una de las cuales se
compone de columnas y filas. Cada columna enumera un atributo de la
entidad en cuestión, por ejemplo, precio, código postal o fecha de
nacimiento. En conjunto, a los atributos en una relación se los llama
dominio. Se elige un atributo particular o combinación de atributos
como clave primaria, a la cual se puede hacer referencia en otras tablas,
en donde se la denomina clave externa.
Cada fila, también denominada tupla, incluye datos sobre una instancia
específica de la entidad en cuestión, por ejemplo, un empleado específico.
El modelo también representa los tipos de relaciones entre esas tablas,
incluidas las relaciones uno a uno, uno a muchos y muchos a muchos.
Las bases relacionales generalmente se escriben en
Lenguaje de Consulta Estructurado (SQL, por sus siglas en
inglés). El modelo fue introducido por E. F. Codd en 1970.
Modelo jerárquico

El modelo jerárquico organiza los datos en una estructura de


árbol, en la que cada registro tiene un único elemento o raíz.
Los registros del mismo nivel se clasifican en un orden
específico. Ese orden se usa a manera de orden físico para
almacenar la base de datos. El modelo es bueno para
describir muchas relaciones del mundo real.
Modelo de red
El modelo de red se basa en el modelo jerárquico, permitiendo
relaciones de muchos a muchos entre registros vinculados, lo que
implica registros principales múltiples. Basado en la teoría matemática
de conjuntos, el modelo se construye con conjuntos de registros
relacionados. Cada conjunto consiste de un registro propietario o
principal y uno o más registros miembros o secundarios. Un registro
puede ser miembro o secundario en múltiples conjuntos, permitiendo
que este modelo represente relaciones complejas.
Modelo de base de datos orientado a objetos

Este modelo define una base de datos como una colección de objetos, o elementos de
software reutilizables, con funciones y métodos relacionados. Hay varios tipos de bases
de datos orientadas a objetos:
Una base de datos multimedia incorpora elementos multimedia, tales como imágenes,
que no se podrían almacenar en una base de datos relacional.
Una base de datos de hipertexto permite que cualquier objeto se conecte a cualquier
otro objeto. Es útil para organizar lotes de datos disímiles, pero no es ideal para análisis
numérico.
El modelo de base de datos orientado a objetos es el mejor modelo conocido de base
de datos posrelacional ya que incorpora tablas, pero no se limita a ellas. A dichos
modelos también se los conoce como modelos de base de datos híbridos.
Modelo relacional de objetos

Este modelo de base de datos híbrido combina la sencillez del modelo


relacional con parte de la funcionalidad avanzada del modelo de base
de datos orientado a objetos. En esencia, permite a los diseñadores
incorporar objetos en una estructura familiar de tablas.

Entre los idiomas e interfaces de llamada se incluyen SQL3, lenguajes


de proveedores, ODBC, JDBC e interfaces de llamada patentadas que
son extensiones de lenguajes e interfaces usadas por el modelo
relacional.
Modelo entidad-relación

Este modelo capta las relaciones entre entidades del mundo real de forma muy
similar al modelo de red, pero no está directamente ligado a una estructura física
de la base de datos. En cambio, con frecuencia se lo usa para diseñar una base de
datos conceptualmente.

Aquí, a las personas, lugares y cosas, acerca de las cuales se almacenan puntos de
datos, se las denomina entidades, cada una de las cuales tiene ciertos atributos
que en conjunto forman su dominio. La cardinalidad, o relaciones entre
entidades, también se representa en diagramas.
Una forma común del diagrama entidad-relación ER es el esquema de estrella, en
el cual una tabla central de información se conecta a múltiples tablas
dimensionales.
Otros modelos de bases de datos

Modelo de archivo invertido


Una base de datos construida con estructura de archivo invertido se diseña para
facilitar búsquedas rápidas de texto completo. En este modelo, el contenido de
datos se indexa como una serie de claves en una tabla de búsqueda, donde los
valores indican la ubicación de los archivos asociados. Esta estructura puede
proporcionar un informe casi instantáneo de, por ejemplo, datos masivos y análisis
estadístico.

Este modelo ha sido usado por el sistema de gestión de bases de datos ADABAS de
Software AG desde 1970, y se sigue utilizando en la actualidad.
Modelo plano
El modelo plano es el modelo de datos más antiguo y más sencillo. Simplemente
presenta todos los datos en una sola tabla, que consiste de columnas y filas. Para
acceder a los datos o manipularlos, la computadora tiene que leer todo el archivo
plano y traerlo a la memoria, lo que vuelve a este modelo ineficiente para todo,
excepto para los conjuntos de datos más pequeños.

Modelo multidimensional
Esta es una variación del modelo relacional diseñado para facilitar un mejor
procesamiento analítico. Aunque el modelo relacional está optimizado para
procesamiento de transacciones en línea (OLTP), este modelo está diseñado para
procesamiento analítico en línea (OLAP).
Cada celda de una base de datos dimensional contiene datos acerca de las
dimensiones registradas por la base de datos. Visualmente, es como una colección de
cubos, en lugar de tablas bidimensionales.
Modelo semiestructurado

En este modelo, los datos estructurales comúnmente contenidos en el


esquema de la base de datos están incrustados con los datos mismos.
Aquí la diferencia entre los datos y el esquema es imprecisa en el mejor
de los casos. Este modelo es útil para describir sistemas, tales como
ciertas fuentes de datos basadas en web, las cuales tratamos como bases
de datos, pero que no podemos limitar con un esquema. También es útil
para describir interacciones entre bases de datos que no se apegan al
mismo esquema.
Modelo de contexto
Este modelo puede incorporar elementos de otros modelos de
bases de datos, según sea necesario. Improvisa elementos de
modelos orientados a objetos, semiestructurados y de red.

Modelo asociativo
Este modelo divide todos los puntos de datos en base a si describen
una entidad o una asociación. En este modelo, una entidad es todo
lo que existe de manera independiente, mientras que una asociación
es algo que solo existe en relación a algo más.
El modelo asociativo estructura los datos en dos grupos:

• Un grupo de elementos, cada uno con un identificador único, un


nombre y un tipo.

• Un grupo de enlaces, cada uno con un identificador único y los


identificadores únicos de una fuente, verbo u objetivo. La información
almacenada tiene que ver con la fuente y cada uno de los tres
identificadores pueden hacer referencia ya sea a un enlace o a un
elemento.
Otros modelos menos comunes de bases de datos incluyen:

Modelo semántico, el cual incluye información acerca de cómo los datos


almacenados se relacionan con el mundo real.

Base de datos XML, la cual permite que los datos sean especificados e incluso
almacenados en formato XML.

Gráfico etiquetado.

Triplestore.
Modelos de bases de datos NoSQL
Además del modelo de base de datos de objetos, otros modelos distintos al
tipo SQL han surgido en contraste con el modelo relacional:

El modelo de base de datos gráfico, el cual es aún más flexible que el modelo
de red, permitiendo que cualquier nodo se conecte a cualquier otro.

El modelo multivalor, el cual se desprende del modelo relacional,


permitiendo que los atributos contengan una lista de datos en lugar de un
solo punto de datos.

El modelo de documentos, el cual se diseña para almacenar y administrar


documentos o datos semiestructurados, en lugar de datos atómicos.
Clasificación de las BD

Una base de datos o banco de datos es un conjunto de datos


pertenecientes a un mismo contexto y almacenados sistemáticamente
para su posterior uso. En este sentido; una biblioteca puede considerarse
una base de datos compuesta en su mayoría por documentos y textos
impresos en papel e indexados para su consulta.
Base de datos de particulares

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al


contexto que se esté manejando, la utilidad de las mismas o las necesidades
que satisfagan.
Según la variabilidad de la base de datos
Bases de datos estáticas

Son bases de datos únicamente de lectura, utilizadas primordialmente para


almacenar datos históricos que posteriormente se pueden utilizar para
estudiar el comportamiento de un conjunto de datos a través del tiempo,
realizar proyecciones, tomar decisiones y realizar análisis de datos para
inteligencia empresarial.
Bases de datos dinámicas

Son bases de datos donde la información almacenada se modifica con el


tiempo, permitiendo operaciones como actualización, borrado y edición de
datos, además de las operaciones fundamentales de consulta. Un ejemplo,
puede ser la base de datos utilizada en un sistema de información de un
supermercado.
Según el contenido

Bases de datos bibliográficas

Solo contienen un subrogante (representante) de la fuente primaria,


que permite localizarla. Un registro típico de una base de datos
bibliográfica contiene información sobre el autor, fecha de
publicación, editorial, título, edición, de una determinada
publicación, etc. Puede contener un resumen o extracto de la
publicación original, pero nunca el texto completo, porque si no,
estaríamos en presencia de una base de datos a texto completo.
ARQUITECTURA BASE DE DATOS
La arquitectura se divide en tres niveles generales: interno, conceptual y
externo.
Nivel Interno
Es el más cercano al almacenamiento físico, es decir, el que concierne a la
manera como los datos se almacenan en realidad.

Nivel Externo
Es el más cercano a los usuarios, es decir, el que atañe a la manera cómo
cada usuario ve los datos.

Nivel Conceptual
Es un nivel de mediación entre los otros dos.
NIVELES ABSTRACCION BASE DE DATOS

Los sistemas de base de datos se diseñan para manejar grandes cantidades


de información. El manejo de los datos implica tanto la definición de
estructuras para el almacenamiento como la creación de mecanismos para
el manejo de la información. Además, el sistema de base de datos debe de
cuidar la seguridad de la información almacenada en la base de datos,
previniendo caídas del sistema o intentos de acceso no autorizados.
En el nivel físico
Se describe cómo se almacenan los datos en cuanto a detalles de
estructuras de datos complejas del nivel más bajo.
En el nivel conceptual
Es el siguiente nivel más alto de abstracción, se describe cuáles son
los datos reales que están almacenados en la base de datos y qué
relaciones existen entre los datos.
El nivel de visión
Es más alto, en el cual se describe solo una parte dela base de
datos y se presentan vistas diferentes de la misma base de datos a
los usuarios.
Lenguaje de definición de datos (DDL).
El resultado de la Compilación de las proposiciones en DDL es un
conjunto de tablas que se almacenan en un archivo especial
llamado diccionario de datos que contiene meta datos, es decir,
“datos acerca de los datos”.

Un lenguaje de manejo de datos (DML).


Permite a los usuarios tener acceso a los datos o manejarlos.
Existen básicamente dos tipos de DML: de procedimientos, que
requieren que el usuario especifique cuáles datos necesita y
cómo se van a obtener, y sin procedimientos, que requieren que
el usuario especifique cuáles son los datos que necesita sin
especificar la forma de obtención.
Un manejador de base de datos.
Es un módulo de programa que constituye la interfaz entre los datos de bajo
nivel almacenados en la base de datos y los programas de aplicaciones y las
consultas que se hacen al sistema. El manejador de base de datos se encarga
de interactuar con el manejador de archivos, de conservar la integridad, de
garantizar la seguridad, del respaldo y recuperación y del control de
concurrencia.

Una base de datos.

es una colección integrada de datos, cada persona y cada programa


autorizado a accesar la base de datos puede hacerlo. Una base de datos bien
diseñada debe de minimizar la cantidad de información redundante.
INDEPENDENCIA LOGICA Y FISICA DE LOS DATOS

La Independencia Física De Datos

debe permitir la realización de estructuras de almacenamiento de datos en forma


independiente de su estructura lógica en la realidad Ventajas: los cambios en la estructura
lógica no implican cambios en la de almacenamiento, las consideraciones sobre el mejor
manejos de los datos almacenados quedan a cargo del SMBD y los cambio en la
estructura de almacenamiento no implican cambios en los Programas de Aplicación.

La Independencia lógica De Datos:

debe permitir una cierta independencia entre los datos vistos por las aplicaciones y la
estructura lógica de ellos en la realidad. Ventajas: soporte de la evolución de los datos y
que cada grupo de trabajo vea esos datos como cada grupo lo desea.
Arquitectura de los sistemas de bases de datos

Hay tres características importantes inherentes a los sistemas


de bases de datos:

La separación entre los programas de aplicación y los datos.

El manejo de múltiples vistas por parte de los usuarios

El uso de un catálogo para almacenar el esquema de la base


de datos.
ANSI-SPARC (American National Standard Institute - Standards Planning and
Requirements Committee) propuso una arquitectura de tres niveles para los
sistemas de bases de datos, que resulta muy útil a la hora de conseguir
estas tres características.

El objetivo de la arquitectura de tres niveles es el de separar los programas


de aplicación de la base de datos física.
En esta arquitectura, el esquema de una base de datos se define en tres niveles
de abstracción distintos:

En el nivel interno se describe la estructura física de la base de datos mediante


un esquema interno.

Este esquema se especifica mediante un modelo físico y describe todos los


detalles para el almacenamiento de la base de datos, así como los métodos de
acceso. Este esquema oculta los detalles de las estructuras de almacenamiento
y se concentra en describir entidades, atributos, relaciones, operaciones de los
usuarios y restricciones.
En el nivel externo se describen varios esquemas externos o
vistas de usuario. Cada esquema externo describe la parte de la
base de datos que interesa a un grupo de usuarios determinado
y oculta a ese grupo el resto de la base de datos.

La mayoría de los SGBD no distinguen del todo los tres niveles.


Algunos incluyen detalles del nivel físico en el esquema
conceptual. En casi todos los SGBD que se manejan vistas de
usuario, los esquemas externos se especifican con el mismo
modelo de datos que describe la información a nivel conceptual,
aunque en algunos se pueden utilizar diferentes modelos de
datos en los niveles conceptual y externo.
Hay que destacar que los tres esquemas no son más que descripciones de
los mismos datos pero con distintos niveles de abstracción. Los únicos datos
que existen realmente están a nivel físico, almacenados en un dispositivo
como puede ser un disco.
El SGBD debe transformar cualquier petición expresada en términos de un
esquema externo a una petición expresada en términos del esquema
conceptual, y luego, a una petición en el esquema interno, que se procesará
sobre la base de datos almacenada.
El proceso de transformar peticiones y resultados de un nivel a otro se
denomina correspondencia o transformación.
Estas correspondencias pueden requerir bastante tiempo, por lo que
algunos SGBD no cuentan con vistas externas.
La arquitectura de tres niveles es útil para explicar el concepto de
independencia de datos que podemos definir como la capacidad para
modificar el esquema en un nivel del sistema sin tener que modificar el
esquema del nivel inmediato superior.

Se pueden definir dos tipos de independencia de datos:

La independencia lógica

La independencia física
La independencia lógica es la capacidad de modificar el
esquema conceptual sin tener que alterar los esquemas
externos ni los programas de aplicación.

Se puede modificar el esquema conceptual para ampliar la


base de datos o para reducirla.

Si, por ejemplo, se reduce la base de datos eliminando una


entidad, los esquemas externos que no se refieran a ella no
deberán verse afectados.
La independencia física es la capacidad de modificar el esquema interno sin
tener que alterar el esquema conceptual (o los externos).

Por ejemplo, puede ser necesario reorganizar ciertos ficheros físicos con el fin
de mejorar el rendimiento de las operaciones de consulta o de actualización de
datos.

Dado que la independencia física se refiere sólo a la separación entre las


aplicaciones y las estructuras físicas de almacenamiento, es más fácil de
conseguir que la independencia lógica.

También podría gustarte