Está en la página 1de 11

Bases de datos

Unidad 1

Introducción

Las empresas reconocían que la información podía tener un gran beneficio, en términos ya sea de la
reducción de costos o del aumento de ingresos, sin embargo el manejo de está era uno de los grandes
problemas a los que se enfrentaban las empresas en la década de los sesenta, ya que su gestión se
realizaba de manera manual y con procedimientos lentos, por lo que se comenzaron a introducir las
computadoras para la automatización en el manejo de la información, surgiendo los sistemas de
información basados en computadora.

La historia de las bases de datos se extiende desde mediados de los años sesenta, y se ha caracterizado
por su excepcional productividad y su impresionante impacto económico, todo esto debido a que las
bases de datos se han convertido en un producto estratégico de primer orden, ya que constituyen el
fundamento se los sistemas de información, y soportan la gestión y la toma de decisiones.

Acerca de las bases de datos

Comencemos por definir una base de datos, a pesar de que son muy numerosas las definiciones de base
de datos todas coinciden en que es:

• Un conjunto, colección o depósito de datos almacenados en un soporte informático no


volátil. Los datos están interrelacionados y estructurados de acuerdo con un modelo capaz
de recoger el máximo contenido semántico.

• Una colección compartida de datos lógicamente relacionados, junto con una descripción de
estos datos (metadatos), que están diseñados para satisfacer las necesidades de información
de una organización.

Propiedades de las bases de datos:

• Están interrelacionadas.
• Son capaces de evolucionar.
• Son accesibles a múltiples aplicaciones.
• Su redundancia es mínima y controlada.

Se dice que los datos están interrelacionados por que cualquier parte de información puede tomarse y
cruzarse con cualquier otra parte de la base de datos. Son capaces de evolucionar ya que en cualquier

1
momento se pueden modificar las características de los datos, su estructura o agregar nuevos datos. Se
puede tener toda la información de una empresa en la misma base de datos y podrá ser accedida por
todas las aplicaciones desarrolladas. La redundancia se refiere a la repetición de los datos, que
idealmente debería ser cero redundancias, sin embargo por cuestiones del modelo o de eficiencia, esto
no siempre puede ser posible.

Evolución de las Bases de Datos

En un principio el centro de atención de la tecnología de información estaba situado en los sistemas


orientados hacia el proceso basados en archivos, los cuales no almacenaban ningún tipo de información
sobre los datos, restricciones, control o proceso; sino que esta información se distribuía en los
programas que accedían a los archivos, presentando graves problemas de redundancia y mantenimiento
al encontrarse dispersa la "semántica" de los datos en los programas. Las aplicaciones se implantaban
independientes unas de otras, cuando necesitaban los datos estos simplemente se duplicaban ya que no
se realizaba transferencia de datos entre ellas. Este tipo de planteamiento producía, desperdicio de
memoria secundaria, altos tiempos de proceso, ya que las mismas operaciones y procesos deberían
repetirse en los diferentes archivos.

2
D1
A1 P1

D2

A2 P2
A
D3

D4
A3 P3
A

A6
D5

A4 P4
D6

A5 P5
D7

Datos Archivos Procesamiento Resultados

Sistemas orientados al proceso basados en archivos

Limitaciones de los sistemas orientados en proceso basados en archivos.

• Separación y aislamiento de los datos


• Duplicación de los datos
• Dependencias entre los datos
• Formatos de archivos incompatibles
• Consultas fijas/proliferación de programas de aplicación

La necesidad de una gestión más flexible y adaptable a las necesidades de la demanda de la información
da surgimiento a un nuevo enfoque basado en una base de datos en la cual estos se organizan y
mantienen en un conjunto estructurado que trata satisfacer las necesidades de información de toda la
organización.

Poco a poco, el centro de atención se desplazó hacia la estructuración de los datos, surgiendo las
primeras aplicaciones para el manejo de información, produciendo un avance importante al almacenarse
la información sobre los datos (su descripción) en la propia base de datos. Sin embargo, en estas
aplicaciones las restricciones sobre los datos se deben comprobar en los programas.
3
Prog. A Prog. B Prog. C

Inf. Procesos

Inf. Control
Inf. Restricciones

BD

Inf. Datos
DATOS

Bases de datos clásicas

Para satisfacer la necesidad de contar con sistemas independientes (independencia físico/lógica) surgen
los Sistemas Gestores de Bases de Datos (SGBD), los cuales han ido incorporado cada vez más
información sobre restricciones en su propio catalogo, y así, en la actualidad, se disponen de sistemas
que permiten definir claves ajenas, restricciones de diferentes tipos, e incluso dominios. Estos sistemas
se nombran como SGBD semánticos. Cabe destacar la aparición a principios de los 90’s de los SGBD
activos en los que se almacena parte de la información sobre el control del sistema, pudiendo ejecutar
acciones sin la intervención del usuario (disparadores, reglas demonios, etc.)

4
Prog. A Prog. B Prog. C

Inf. Procesos

Inf. Control

BD

Restricciones
Inf. Datos
DATOS

Bases de datos semánticas

Niveles de abstracción en las bases de datos.

Se puede observar en los Sistemas de Información la existencia de dos estructuras distintas, la lógica
(vista del usuario) y la física (forma en que se encuentran los datos en el almacenamiento). En las bases
de datos aparece un nuevo nivel de abstracción que se ha denominado de diversas maneras: nivel
conceptual, lógico global, etc. Esta estructura intermedia pretende una representación global de los datos
que se interponga entre las estructuras lógica y física de la arquitectura a dos niveles, siendo
independiente, tanto del equipo como de cada usuario en particular.

Aun cuando en trabajos y propuestas de normalización anteriores ya se había indicado la convencía de


separar los tres niveles de estructuras, ninguno de estos trabajos profundizo tanto en el tema ni tubo un
impacto semejante al de la arquitectura triesquematica de ANSI.

El comité propone la arquitectura ANSI/X3/SPARC para visualizar la base de datos desde tres
perspectivas distintas, teniendo como principal objetivo conseguir la independencia entre datos y
aplicaciones separando la vista que cada usuario tiene de la base de datos de la forma en que se
representa la base de datos físicamente.

Vista Vista Vista


Nivel externo: externa externa externa
Perspectiva de cada aplicación. A B C

Nivel conceptual:
Perspectiva de la comunidad de
Vista conceptual
aplicaciones.-Contiene no solamente datos 5
sino también las relaciones y las restricciones
Nivel interno: Vista interna
Perspectiva del almacenamiento físico

Arquitectura de la base de datos Base de


datos

Los tres niveles de la arquitectura de un SGBD

Con está arquitectura los programas de aplicación podrán acceder a la base de datos desde el nivel
externo, y el SGBD hará el mapeo entre un nivel y otro, logrando una independencia física y lógica, con
las cuales los programas de aplicación no sufren cambios ya que los cambios en el almacenamiento
físico de la BD ó en la estructura conceptual solo alterarán el esquema interno, y en el nivel conceptual
respectivamente.

El NIVEL FÍSICO (interno), es la representación del nivel más bajo de abstracción, en éste se describe
en detalle la forma en como de almacenan los datos en los dispositivos de almacenamiento. El
contenido del esquema interno es muy dependiente de cada SGBD. Es la forma en que el SGBD y el
sistema operativo perciben los datos.

El NIVEL CONCEPTUAL (LÓGICO), es el siguiente nivel de abstracción, describe que datos son
almacenados realmente en la base de datos y las relaciones que existen entre los mismos, describe la
base de datos completa en términos de su estructura de diseño. El nivel conceptual lo usan los
administradores de Bases de Datos.

Consta de las siguientes definiciones:

• Definición de los datos: Se describen el tipo de datos y la longitud de los campos.

• Relaciones entre datos: Se definen las relaciones entre datos para enlazar tipos de
registros relacionados.

El nivel más alto de abstracción, EXTERNO, es la visión que tiene de la base de datos cada usuario en
particular, describe sólo una parte de la base de datos al usuario acreditado para verla. El sistema puede
proporcionar muchas visiones para la misma base de datos.

6
Sistemas Gestor (Manejador) de Base de Datos (Data Base Management System).

Un Sistema Gestor de Bases de Datos es una aplicación (de software de base), formada por una
colección de numerosas rutinas interrelacionadas, cada una de las cuales realiza tareas específicas,
definir, crear, acceder, respaldar, recuperar y administrar la base de datos, garantizando su seguridad,
integridad y protección de los datos, así como la sincronización del acceso de múltiples aplicaciones,
sirviendo de interfaz entre los diferentes tipos de usuarios y la BD.

Operaciones típicas que debe realizar un SGBD:

Sobre el conjunto de la base Sobre registros concretos

Creación Inserción

Reestructuración Borrado Actualización

Consulta a la totalidad Modificación

Consulta Selectiva.

Instancias y Esquemas

Las bases de datos van cambiando a lo largo del tiempo conforme la información se inserta y se borra.
Una base de datos puede tener esquemas e instancias de esquemas (también conocidos como
ejemplares).

Un esquema de base de datos, es el conjunto de especificaciones que se hacen para describir la


estructura completa de una Base de Datos.

Un esquema es la representación de una realidad construida usando un modelo de datos específico. Un


esquema es una colección estática invariable de representaciones lingüísticas y gráficas que describen la
estructura de los datos de interés.

La información almacenada en la base de datos en un momento determinado del tiempo se denomina


una instancia o ejemplar de la base de datos. Un esquema de una base de datos puede tener múltiples
instancias, el estado de la base de datos en un punto particular del tiempo corresponde a una de las
instancias que puede tener. La evolución de la base de datos puede ser vista como una transición de una
instancia a otra, causada por alguna operación que modifica la base de datos.
7
Independencia de datos

El concepto de independencia de los datos, es un elemento clave en las bases de datos, que implica la
separación entre el almacenamiento y la organización lógica de los datos tal como estos se contemplan
por los diferentes programas de aplicación que hacen uso de la BD.

La capacidad de modificar una definición de esquema en un nivel sin que afecte a una definición de
esquema en el siguiente nivel más alto se llama independencia de datos. DATE define la independencia
como “la inmunidad de las aplicaciones ante cambios de la estructura de almacenamiento y en las
técnicas de acceso”.

Hay dos niveles de independencia de datos:

Independencia lógica de datos: Capacidad de modificar el esquema lógico sin causar que los
programas de aplicación tengan que reescribirse.

La independencia de datos lógica es más difícil de proporcionar que la independencia de datos física, ya
que los programas de aplicación son fuertemente dependientes de la estructura lógica de los datos a los
que ellos acceden.

Independencia física: Capacidad de modificar el esquema físico sin provocar que los programas de
aplicación tengan que reescribirse. (Las modificaciones en el nivel físico son ocasionalmente necesarias
para mejorar el funcionamiento).

Usuarios de la Base de Datos

Los usuarios de la base de datos son las personas que interactúan con el sistema de base de datos y los
podemos clasificar de 4 formas:

• Programador de Aplicaciones. Este usuario normalmente escribe aplicaciones de usuario final en


algún lenguaje de programación, o en algún lenguaje anfitrión del DBMS.

• Usuario Avanzado. Es un usuario que a través de un lenguaje adecuado, realiza consultas a la base
de datos para poner a su disposición información que más tarde será tratada con otras
herramientas computacionales.

• Usuario Especializado. Es un usuario que, a través de herramientas computacionales, le puede dar


un tratamiento especial a los datos para que sean más útiles a la organización (data mining, data
warehouse, sistemas expertos, bases de conocimientos, etc.).

8
• Usuarios finales. Estos usuarios normalmente utilizan un programa de aplicación de usuario final
para interactuar de una forma totalmente transparente sobre la base de datos.

Sistema de Base de Datos

Sistema computacional integrado por cuatro elementos: los datos o información, el hardware, el
software y los usuarios; cuya finalidad es almacenar información y permitir a los usuarios recuperarla y
actualizarla con base en sus requerimientos.

El objetivo principal de un Sistema de Base de Datos es disminuir los siguientes aspectos:

La redundancia e inconsistencia de datos

Puesto que los archivos que mantienen almacenada la información son creados por diferentes tipos de
programas de aplicación existe la posibilidad de que, si no se controla adecuadamente el
almacenamiento, se pueda originar duplicidad de información. Esto evidentemente, incrementa los
costos de almacenamiento y acceso a los datos, además de que puede originar inconsistencia.

Dificultad para tener acceso a los datos

Un sistema de base de datos debe contemplar un entorno de datos que le facilite al usuario su manejo.
Supóngase un banco, y que uno de los gerentes necesita averiguar los nombres de todos los clientes que
viven dentro del código postal 94320 de la ciudad. El gerente pide al departamento de procesamiento de
datos que genere la lista correspondiente y el sistema de base de datos debe de ser capaz de manejar
esta situación.

Aislamiento de los datos

Puesto que los datos están repartidos en varios archivos, y estos no pueden tener diferentes formatos, es
difícil escribir nuevos programas de aplicación para obtener los datos apropiados, así los datos pueden
quedar aislados.

Anomalías del acceso concurrente

Para mejorar el funcionamiento global del sistema y obtener un tiempo de respuesta más rápido,
muchos sistemas permiten que múltiples usuarios actualicen los datos simultáneamente. En un entorno
así, la interacción de actualizaciones concurrentes puede dar por resultado datos inconsistentes. Para
prevenir esta posibilidad debe mantenerse un fuerte control de los accesos concurrentes.

Problemas de seguridad

La información de toda empresa es importante aunque unos datos lo son más que otros, por tal motivo
se debe considerar el control de acceso a los datos, ya que no todos los usuarios deben ver cierta

9
información; por tal motivo para que un sistema de base de datos sea confiable debe mantener un grado
de seguridad que garantice la autentificación y protección de los datos.

Problemas de integridad de los datos

Los valores de datos almacenados en la base de datos deben satisfacer cierto tipo de restricciones de
consistencia. Estas restricciones se hacen cumplir en el sistema añadiendo código apropiado en los
diversos programas de aplicación.

Administrador de base de datos (DBA). Es la persona o equipo de personas profesionales responsables


del control y manejo del Sistema de Base de Datos, generalmente tienen experiencia en: el manejo de
DBMS, en el diseño de bases de datos, en la administración de sistemas operativos, en la comunicación
de datos, en la operación de hardware y en programación. Funciones del DBA:

• Definición de los esquemas de la base de datos

• Definición de la estructura de almacenamiento y de los métodos de acceso

• Modificación del esquema y la organización física

• Concesión de autorización para acceso a los datos

• Especificación de las restricciones de integridad.

• Mantenimiento rutinario.

Seguridad en BD

El aspecto global de seguridad de los datos está muy vinculado al propio concepto de lo que es una base
de datos:” conjunto integrado de datos, adecuados a varios usuarios y a diferentes usos”. Es el propio
uso concurrente de los datos el que, en muchos casos, plantea problemas de seguridad que el
administrador de la base de datos debe mitigar, en la medida de lo posible con las facilidades que le
proporciona el SGBD.

La protección de los datos deberá llevarse a cabo contra fallos físicos, fallos lógicos y fallos humanos,
ya sean estos intencionados o no. Estos fallos alteran indebidamente los datos, los corrompen, con lo
que la base de datos ya no puede servir a los fines para los que fue creada.

El SGBD facilita normalmente mecanismos para prevenir los fallos, para detectarlos una vez que se han
producido y para corregirlos después de que han sido detectados.

Actualmente se considera que la seguridad comprende tres aspectos fundamentales:

Confidencialidad: solo mostrar los datos a los usuarios autorizados.

10
Accesibilidad: que la información se encuentre disponible.

Integridad: asegurar que los datos no se han falseado.

Una base de datos está generalmente definida como un conjunto integrado de datos que modelan un
universo dado. Este universo está compuesto por objetos inter-relacionados, los objetos de un mismo
tipo constituyen una entidad y el lazo existente entre entidades se le denomina asociación.

El proceso de descripción de asociaciones y entidades se llama modelado y se hace con la ayuda de un


modelo de datos.

Ciclo de vida de una base de datos:


El ciclo de vida de una base de datos puede descomponerse en 3 etapas:
1. Concepción: la fase de concepción consiste en reproducir el mundo real con ayuda de uno de los
modelos de datos conocidos. El resultado de esta fase en un esquema escrito según un
formalismo cualquiera no interpretable por el SGBD.
2. Creación de la B.D. vacía: La 2ª fase consiste en traducir este esquema en ordenes
comprensibles para el SGBD como resultado se obtiene la estructura de la base de datos
desprovista de cualquier tipo de información.
3. Explotación: Es en esta fase donde los registros serán manipulados con la ayuda de los
lenguajes de programación. Es ahora cuando los usuarios pueden consultar los datos y ponerlos a
punto durante el resto de la vida de la base de datos.

11

También podría gustarte