Está en la página 1de 25

Universidad Central de Venezuela Facultad de Ciencias Escuela de Computacin BASES DE DATOS

Tema 1: Fundamentos y Conceptos Bsicos de Bases de Datos

Profa. Mercy Ospina T. Caracas, 03 de septiembre de 2009


Centro de Investigacin en Sistemas de Informacin CISI.

Tema 1: Conceptos Bsicos de Base de Datos

INDICE

CONTENIDO
INTRODUCCIN ...................................................................................................................................................3 CONCEPTOS BASICOS DE BASE DE DATOS. ..........................................................................................................4 1. Procesamiento de Archivos Vs. Procesamiento de Base de Datos .........................................................4 1.1. 1.2. 2. Sistemas de Procesamiento de Archivos. ......................................................................................4 Sistemas de Procesamiento de Base de Datos. .............................................................................6

Qu es una Base de Datos? ..................................................................................................................8 2.1. 2.2. Caractersticas de una Base de Datos ............................................................................................8 Desventajas de una Base de Datos ................................................................................................8

3.

Sistemas de Bases de datos ....................................................................................................................9 3.1. 3.2. 3.3. 3.4. 3.2. Arquitectura para Sistemas de Bases de Datos .............................................................................9 Independencia de datos ..............................................................................................................11 Ejemplares y Esquemas ...............................................................................................................12 Lenguajes de Bases de Datos .......................................................................................................12 Componentes de un SBD .............................................................................................................14

4.

Sistema Manejador de Base de Datos (SMBD) .....................................................................................16 4.1. 4.2. 4.3. Las Funciones del SMBD: .............................................................................................................17 Componentes Funcionales del Sistema Manejador de Base de Datos[2 ...................................19 Ventajas y Limitaciones de los Sistemas Manejadores de Base de Datos: ..................................21

5.

Administrador de BD (DBA: DATABASE ADMINISTRATOR)...................................................................21 5.1. Funciones del ABD .......................................................................................................................22

6.

Control de Seguridad ............................................................................................................................23 6.1. 6.2. Conceptos bsicos de seguridad ..................................................................................................23 El modelo de Seguridad bsico. ...................................................................................................24

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos INTRODUCCIN

Toda empresa u organizacin necesita tener un control centralizado de sus datos, y las computadoras operan sobre datos que han sido organizados dentro de agrupamientos lgicos. Normalmente, los datos que las computadoras manejan estn organizados en agrupamientos lgicos, para que los procesos sean efectivos y los resultados obtenidos sean tiles. Este documento se ha realizado con el objetivo de servir de gua a los estudiantes de la catedra Base de Datos, y se tomo como base el primer captulo de la publicacin de docencia ND 2001- 02 de las Profesoras Concettina Di Vasta* y Rossana Daz, realizada en Abril de 2001 (Lecturas en Ciencias de la Computacin ISSN 1316-6239), la cual fue actualizada con las ltimas ediciones de la bibliografa. En esta gua se define lo que son las Bases de Datos y su origen, se estudiar en detalle las caractersticas de las bases de datos, los distintos usuarios, lenguajes y operaciones sobre las bases de datos, adems se estudiar los sistemas manejadores de base de datos, sealando sus principales componentes, ventajas y limitaciones, as como las funciones del administrador de Base de Datos.

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

CONCEPTOS BASICOS DE BASE DE DATOS.


1. PROCESAMIENTO DE ARCHIVOS VS. PROCESAMIENTO DE BASE DE DATOS

Para realizar el procesamiento de la data con el objeto de obtener informacin utilizando tecnologa computacional se estudiaran dos enfoques: Sistemas de Procesamiento de Archivos. Sistemas de Procesamiento de Base de Datos.

1.1.

SISTEMAS DE PROCESAMIENTO DE ARCHIVOS.

Los Sistemas de Procesamiento de Archivos fueron uno de los primeros intentos para informatizar los sistemas de archivo manual, por ejemplo para almacenar la correspondencia, llevar control de facturas, generacin de informes peridicos, entre otros y fueron creados para satisfacer las necesidades de las empresas para acceder de forma ms eficiente a los datos. Estos sistemas almacenan grupos de registros en archivos separados, los cuales se procesan de forma independiente, como se muestra en la Figura # 1. Lo que se hizo fue usar un enfoque descentralizado, en el que cada departamento, con ayuda de personal especializado, almacenaba y controlaba sus propios datos

Programa de aplicacin para clientes

Archivo clientes

Servicio de Clientes

Programa de aplicacin para ordenes

Archivo ordenes

Entrada de Ordenes
FIGURA # 1. SISTEMA DE PROCESAMIENTO DE ARCHIVOS

En este enfoque, cada aplicacin o rea funcional de la organizacin tiene su propio conjunto de archivos maestros y de transacciones, que se usan para almacenar, procesar y recuperar sus propios datos. Los archivos y programas se disean especficamente para cada aplicacin, y las aplicaciones son independientes entre si. Adems la manera segn la cual se almacenan los datos (estructura de registros) es propia de la aplicacin y no puede ser alterada fcilmente.
CISI - GDBD2009 4

Tema 1: Conceptos Bsicos de Base de Datos

P ROBLEMAS DE LOS S ISTEMAS DE P ROCESAMIENTO DE A RCHIVOS El enfoque anterior presentaba los siguientes inconvenientes: 1. Redundancia de Datos: consiste en el almacenamiento de informacin idntica en mltiples archivos. Debido al enfoque descentralizado, esta tcnica promueve, o requiere, una duplicacin incontrolada de los datos por lo que la misma informacin pueden ser registrados en ms de una aplicacin. Almacenar y mantener los mismos datos en varios archivos a la vez resulta indeseable por varias razones: Implica un desperdicio de recursos, cuesta tiempo y dinero ingresar y mantener los datos ms de una vez. Se consume espacio de almacenamiento innecesario ya que requiere guardar varias veces los mismos datos. Puede llevar a inconsistencia de la data, es decir, las diversas copias de los mismos datos no concuerdan entre s. Por ejemplo consideremos el caso de duplicacin de datos en los departamentos de personal y de nmina, si un empleado cambia de domicilio y este cambio solo se comunica al departamento de personal y no al de nmina, la nmina de este empleado puede ser enviada a la direccin incorrecta.

2.

Falta de integridad de los datos: Los valores de datos almacenados en la BD deben satisfacer ciertos tipos de restricciones de consistencia, por ejemplo. El saldo de una cuenta no puede ser menor que 0, ya que una coleccin de datos tiene integridad si es lgicamente consistente. Los programadores hacen cumplir estas restricciones aadiendo el cdigo correspondiente a los diferentes programas de aplicacin. Sin embargo cuando se aaden nuevas restricciones es difcil cambiar todos los programas de aplicacin, lo cual se complica si existe mucha redundancia.

3. Poca flexibilidad a los cambios: Cambiar algunas caractersticas de un archivo de manera frecuente resulta extremadamente difcil, pues cualquier aplicacin u otros archivos que accedan al primero tambin deben ser cambiados. Asimismo emitir nuevas consultas o informes tambin requiere cambios en los programas, y la creacin de nuevos archivos. Esto reduce la posibilidad de hacer cambios rpidamente. 4. Interdependencia del Programa y archivos de datos: Como ya se ha mencionado, la estructura fsica y el almacenamiento de archivos y registros de datos, estn definidos en el cdigo de la aplicacin, por lo que cambiar las caractersticas de los campos en un archivo determinado suele ser difcil o imposible. Si se requiere cambiar el tamao de un campo, por ejemplo, un campo de direccin pasa de 40 a 50 caracteres, o se desea agregar, o borrar un campo, se requiere de la creacin de un programa especial que cambie el formato del archivo,
5

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

con todas las operaciones que esto puede implicar. Si se ha agregado un nuevo campo al registro, la informacin debe ser introducida manualmente para cada registro. 5. Dificultad para compartir datos entre aplicaciones: Debido a que la estructura de los archivos est incrustada en los programas de aplicacin, dicha estructura depender del lenguaje de programacin, esta incompatibilidad hace que difcil que una aplicacin use archivos generados por otra, para obtener datos que considere necesarios. 6. Problemas de seguridad: debido a la proliferacin de archivos y programas de aplicacin, se alcanzo un punto donde era muy difcil gestionar todos los datos, por lo que a menudo se omitan mecanismos de seguridad de manera que no todos los usuarios pudieran acceder a todos los datos. Por ejemplo, en un sistema bancario, el personal de las nminas solo necesita ver informacin acerca de los distintos empleados del banco, no ver informacin sobre las cuentas. En otras palabras no existe ningn control sobre el acceso o manipulacin de los datos, mas all de los impuestos por los propios programas de aplicacin.

1.2.

SISTEMAS DE PROCESAMIENTO DE BASE DE DATOS.

La tecnologa de base de datos fue desarrollada para superar las limitaciones y problemas de los sistemas de procesamiento de archivos. En los sistemas de procesamiento de base de datos se usa un enfoque centralizado de los datos para lo cual se aade un nuevo componente (Figura # 2), el Sistema Manejador de Base de Datos (SMBD), que es el conjunto de programas y hardware que se encargan del manejo de los datos.

Programa de aplicacin para clientes Servicio de Clientes Clientes Ordenes

SMBD Programa de aplicacin para ordenes

Entrada de Ordenes
FIGURA # 2. SISTEMA DE PROCESAMIENTO DE BASE DE DATOS

V ENTAJAS DE LOS S ISTEMAS DE P ROCESAMIENTO DE B ASE DE D ATOS . 1. Es posible disminuir la redundancia y la inconsistencia de datos: En esta tcnica se trata de disminuir la redundancia integrando los archivos en una estructura llamada Base de Datos, por lo que se disminuye la duplicidad de los datos, Adems un solo ente se encarga del manejo y actualizacin de los datos, el Sistema Manejador de Base de Datos (SMBD). Los
CISI - GDBD2009 6

Tema 1: Conceptos Bsicos de Base de Datos

programas de aplicacin pueden preguntar al SMBD para acceder cualquier tipo de data, por lo que cada rea podr ver y actualizar los mismos datos evitando la inconsistencia.

1. Es posible mantener la integridad: La integridad se suele expresar en trminos de


restricciones que pueden aplicarse a los elementos de datos contenidos en un nico registro o a relaciones entre registros. El SMBD se encarga de hacer cumplir las diferentes restricciones sobre los datos, y resulta sencillo cambiar o definir nuevas restricciones. Al tener un control centralizado de la base de datos, el Administrador de la Base de Datos (DBA) puede garantizar la observancia de todas las normas aplicables para la representacin de los datos. 2. Es posible compartir los datos.: El compartir datos implica no slo que las aplicaciones ya existentes pueden compartir la informacin de la base de datos, sino tambin que se pueden desarrollar nuevas aplicaciones para trabajar con los mismos datos almacenados, esto es posible debido a que la base de datos no es propiedad de los departamentos sino de toda la organizacin. 3. Mayor flexibilidad para los cambios: El SMBD maneja todas las definiciones de los archivos y registros, por lo que tiene funcionalidades que permiten hacer cambios en los campos de manera rpida, asimismo permite generar nuevas consultas e informes dinmicamente, sin cambiar los programas de aplicacin. 4. Es posible aplicar restricciones de seguridad: La seguridad de la BD es la proteccin de los datos frente al uso por personas no autorizadas, la integracin de los datos hace que estos sean ms vulnerables que en el enfoque de procesamiento de archivos. Sin embargo al tener jurisdiccin completa sobre la base de datos, el ABD puede: a. Asegurar que el acceso a la base de datos sea slo a travs de los canales apropiados y, por tanto, b. Definir las verificaciones de seguridad a realizar cuando se intente acceder a informacin delicada. El SMBD hace posible el cumplimiento de las restricciones de seguridad definidas por el ABD. 5. Posibilidad de recuperacin de los datos en caso de fallas: Los SMBD fueron diseados con mecanismos que permiten recuperar los datos en caso de que sucedan fallas que impliquen perdidas de estos. 6. Mas accesibilidad a los datos y mejor capacidad de respuesta: Ahora los datos pertenecientes a otros departamentos pueden ser accesibles desde cualquier lugar de la organizacin y los SMBD proporcionan lenguajes que permiten a los usuarios plantear consultas ad-hoc y tener la informacin requerida casi inmediatamente sin tener que contar con un programador que escriba un programa que extraiga la informacin de la Base de Datos.

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

2. QU ES UNA BASE DE DATOS?


Una base de datos es un repositorio centralizado de datos lgicamente relacionados, que permite almacenar y organizar hechos eventos y restituirlos a demanda de el, o los usuarios para producir informacin. Tambin se puede definir como una coleccin de registros o archivos relacionados lgicamente. Una BD consolida muchos registros almacenados previamente en archivos independientes, de modo que un cmulo (pool) comn de registros sirvan como una sola central para muchas aplicaciones de procesos que necesitan este tipo de datos.

formada Base de Datos Archivos Registros Campos

Una base de datos est constituida por un conjunto de datos persistentes diseados para satisfacer las necesidades de informacin de una organizacin, por lo que deja de ser propiedad de un departamento y pasa a ser un recurso corporativo compartido.

2.1.

CARACTERSTICAS DE UNA BASE DE DATOS


1.- Control centralizado de los datos. 2.- Integridad de los datos. 3.- Minimizacin de la redundancia. 4.- Independencia de los datos y las aplicaciones. 5.- Acceso concurrente a los datos. 6.- Costo mnimo de almacenamiento y mantenimiento. 7.- Versatilidad para la representacin de relaciones. 8.- Establecimiento de medidas de seguridad. 9.- Facilidad para el cambio de hardware o software. 10.- Recuperacin en caso de fallas.

2.2.

DESVENTAJAS DE UNA BASE DE DATOS


Las BD ms sofisticadas, enfocadas a grandes empresas son costosas, sin embargo debido al desarrollo de software libre podemos encontrar algunas bases de datos muy buenas que son gratuitas. Representan un consumo de recursos elevados, lo cual ya no es tan problemtico debido a la disminucin del costo de los medios de almacenamiento.
8

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

Se requiere de personal capacitado. La recuperacin de una base de datos despus de una falla puede requerir bastante tiempo.

3. SISTEMAS DE BASES DE DATOS


Un Sistema de Bases de Datos es un Sistema de Informacin diseado para manejar grandes cantidades de datos y producir informacin. Un sistema de bases de datos es bsicamente un sistema computarizado cuyo propsito general es mantener informacin y hacer que ste disponible cuando se solicite. La informacin en cuestin puede ser cualquier cosa que se considere importante para el individuo o la organizacin a la cual debe servir el sistema; dicho de otro modo, cualquier cosa necesaria para apoyar el proceso general de atender los asuntos de un individuo u organizacin [1].

3.1.

ARQUITECTURA PARA SISTEMAS DE BASES DE DATOS

Para que el sistema sea til debe recuperar los datos eficientemente, para ello los diseadores pueden definir estructuras de datos complejas (listas enlazadas, arboles, etc) para la representacin de los datos en la base de datos. Dado que muchos usuarios de sistemas de bases de datos no tienen formacin en informtica se debe ocultar esta complejidad mediante varios niveles de abstraccin. [1] En 1971 se elabor una de las primeras propuestas de terminologa estndar y de arquitectura general para los sistemas de bases de datos, cuyo responsable fue el Data Base Task Group (DBTG, grupo de trabajo de base de datos), la arquitectura ANSI/PARC [4], la cual divide el SBD en tres niveles de abstraccin (Figura # 4), denominados niveles interno, conceptual y externo. En trminos generales:

Nivel Externo

Esquema de Vistas Vista 1 Vista 2

...

Vista n

Independencia Lgica Nivel Conceptual Esquema Lgico Independencia Fsica Nivel Interno Esquema Fsico

Datos

FIGURA # 4. LOS TRES NIVELES DE LA ARQUITECTURA.

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

a. Nivel Externo (Esquema de Vistas): Es el nivel ms alto de abstraccin, en l se describen slo vistas o subconjuntos de la BD completa, esto con el fin de mostrar a los usuarios slo las partes que necesitan. Es el nivel ms cercano a los usuarios, es decir, es el que se ocupa de la forma como los usuarios individuales perciben los datos. Cada usuario tiene una vista del mundo real, e incluye nicamente aquella porcin de los datos que es de inters para el usuario, los dems datos seguirn existiendo pero el usuario no ser consciente de esto. Adems las diferentes vistas pueden ser diferentes representaciones de los mismos datos, por ejemplo un usuario puede ver las fechas en formato (dia, mes, ao) mientras que otros podrn verlas con el formato (ao, mes, dia), otras vistas pueden incluir datos calculados a partir de los datos almacenados, por ejemplo la edad de un empleado. b. Nivel Lgico o Conceptual (Esquema Conceptual): Es el siguiente nivel que se define, describe que datos son realmente almacenados en la BD, as como las relaciones que existen entre estos. Se describe la BD a travs de un nmero pequeo de estructuras relativamente simples, ocultando las estructuras complejas del nivel fsico. Es un nivel de mediacin entre los otros dos. Los ABD usan este nivel de abstraccin. Este nivel contiene la estructura lgica de toda la Base de Datos, es una vista completa de los datos de la organizacin, y proporciona soporte a cada una de las vistas externas, de manera que todos los datos accesibles por el usuario deben estar contenidos o ser calculados con los datos de este nivel. c. Nivel Interno (Esquema Fsico): Es el nivel ms bajo, el ms cercano al almacenamiento fsico, es decir, es el que se ocupa de la forma como se almacenan fsicamente los datos y describe en detalle las estructuras de datos complejas utilizadas. Este nivel utiliza los mtodos de acceso del sistema operativo (tcnicas de manejo de archivos y extraccin de registro de datos) con el fin de almacenar los datos ingresados por el usuario. El nivel interno se ocupa de conceptos tales como: La asignacin de espacio de almacenamiento para los datos y otras estructuras de apoyo como ndices. Las descripciones y ubicacin de los registros Compresin y cifrado de datos.

CISI - GDBD2009

10

Tema 1: Conceptos Bsicos de Base de Datos

3.2.

INDEPENDENCIA DE DATOS

Uno de los objetivos de la arquitectura de tres niveles es permitir implementar el concepto de Independencia de Datos, definida como la capacidad de modificar la definicin del esquema en los niveles inferiores, sin que se vean afectados los niveles ms altos, existen dos tipos de independencia de datos: Independencia Fsica: Se define entre el nivel fsico y el nivel conceptual. Capacidad de modificar el esquema fsico sin alterar el esquema lgico de la BD. Debe ser posible efectuar cambios en el esquema interno, como por ejemplo utilizar diferentes estructuras o dispositivos de almacenamiento, modificar algoritmos de bsqueda, sin tener que cambiar los esquemas conceptuales o externos. Independencia Lgica: Se define entre el nivel externo y el nivel conceptual. Capacidad de modificar el esquema lgico de la BD sin obligar a reescribir los programas de aplicacin. Debe ser posible efectuar cambios en el esquema lgico, como por ejemplo agregar un campo fax a los datos de clientes o agregar a la base de datos una entidad productos, sin necesidad de modificar los esquemas externos existentes ni reescribir los programas de aplicacin disponibles.
Usuario A1
Lenguaje Anfitrin + DSL

Uusario A2
Lenguaje Anfitrin + DSL Lenguaje Anfitrin + DSL

Usuario B1
Lenguaje Anfitrin + DSL

Usuario B2
Lenguaje Anfitrin + DSL

Usuario B3

*Esquema externo A
Esquemas y correspondencias construidas y mantenidas por el administrador de base de datos (DBA)

Vista externa A

*Esquema externo B

Vista externa B

Correspondencia Correspondencia externa - conceptual A externa - conceptual B


Sistema de administracin de base de datos (DBMS)

Vista conceptual

Correspondencia conceptual - interna

Definicin de estructura de almacenamiento (esquema interno)

* Interfaz con el usuario


Base de datos almacenada (Vista interna)
FIGURA # 5. ARQUITECTURA DETALLADA DEL SISTEMA

CISI - GDBD2009

11

Tema 1: Conceptos Bsicos de Base de Datos

3.3.

EJEMPLARES Y ESQUEMAS

Las Bases de Datos van cambiando a lo largo del tiempo conforme la informacin se inserta y se elimina. La coleccin de informacin almacenada en un momento dado se denomina ejemplar o instancia de la base de datos, tambin llamada estado. El diseo general se denomina esquema de la base de datos. Los esquemas se modifican rara vez, si es que se modifican Los sistemas de bases de datos tienen varios esquemas segn los niveles de abstraccin ya explicados. El esquema fsico describe el diseo de la base de datos a nivel fsico (archivos y registros), el esquema lgico describe el diseo de la base de datos a nivel lgico. Las bases de datos pueden tener varios esquemas de vista llamados subesquemas, que describen las vistas las vistas de la base de datos. [2]

3.4.

LENGUAJES DE BASES DE DATOS

Un sistema de base de datos proporciona dos tipos de lenguajes diferentes: uno para especificar el esquema de base de datos y el otro para expresar las consultas y actualizaciones de la base de datos. [2] 1. Lenguaje de Definicin de Datos (DDL: Data Definition Language): Un esquema de base de datos se especifica mediante un conjunto de definiciones expresadas mediante un lenguaje especial llamado Lenguaje de Definicin de Datos. Este lenguaje permite definir la estructura lgica (o esquema) de la BD y los subesquemas o vistas. El esquema define las caractersticas de los registros dentro de un archivo: los campos de cada registro, sus nombres, el tipo de dato y la extensin. Un subesquema es la manera en la cual a un programa de aplicacin o a un usuario especfico se les permite acceder los datos de un archivo. Esto puede limitar el acceso a los campos definir los derechos de acceso (slo leer, leer y escribir). El resultado de la compilacin de las instrucciones en DDL es un conjunto de tablas que se almacenan en un archivo especial llamado Diccionario de Datos o Directorio de Datos.
Un diccionario de datos es un archivo que contiene metadatos; es decir, datos acerca de los datos. Este archivo se consulta antes de leer o modificar los datos reales del sistema de base de datos.

La estructura de almacenamiento y los mtodos de acceso usados por el sistema de base de datos se especifican mediante un conjunto de definiciones en un tipo especial del DDL llamado un lenguaje de almacenamiento y definicin de datos. El resultado de la compilacin de estas definiciones es un conjunto de instrucciones para especificar los detalles de implementacin de los esquemas de la base de datos - los detalles normalmente se ocultan a los usuarios. 2. Lenguaje de Manipulacin de Datos (DML: Data Manipulation Language): Es un lenguaje que permite a los usuarios tener acceso a los datos organizados mediante el modelo de datos apropiado o manipularlos. Los tipos de acceso son:
CISI - GDBD2009 12

Tema 1: Conceptos Bsicos de Base de Datos

La recuperacin de informacin almacenada en la base de datos. La insercin de informacin nueva en la base de datos. El borrado de informacin de la base de datos. La modificacin de informacin almacenada en la base de datos.

Incluye todos los comandos que permiten al usuario almacenar, recuperar, cambiar, borrar u ordenar los datos o registros dentro de la BD. Hay dos tipos bsicamente: DML procedimentales: Requieren que el usuario especifique qu datos se necesitan y cmo obtener esos datos. DML declarativos (no procedimentales): Requieren que el usuario especifique qu datos se necesitan, sin especificar cmo obtener esos datos. Los DML declarativos suelen ser ms fciles de aprender y de usar que los procedimentales, pero requieren que el SBD, determine la forma ms eficiente de acceder a los datos. Una consulta es una instruccin de solicitud para recuperar informacin. La parte de un DML que implica recuperacin de informacin se llama lenguaje de consultas. Algunas operaciones sobre una BD. Consultas de BD: Solicitar a la BD la informacin especfica. Una consulta puede ser una bsqueda simple de un registro especfico o una solicitud de seleccionar todos los registros que satisfagan un conjunto de criterios. Una vez hecha la seleccin, se puede producir un listado. Ordenamiento de los datos: Para poder usar los datas en la forma ms eficiente. Es posible acomodar los registros en orden alfabtico o numrico con base en los valores de uno o ms campos. Impresin de informes, etiquetas y formatos de cartas: Salidas impresas, informes: lista ordenada de los campos y registros seleccionados en un formato fcil de leer. Producir etiquetas para envos por correo y formatos de cartas personalizados.

CISI - GDBD2009

13

Tema 1: Conceptos Bsicos de Base de Datos

3.2.

COMPONENTES DE UN SBD

En la Figura # 3 se muestra la forma como se integran los cuatro componentes principales de un sistema de base de datos: la informacin, el equipo, los programas y los usuarios [1].

Base de datos

Programas de aplicacin

Usuarios finales

Figura # 3. Esquema simplificado de un sistema de base de datos.

Informacin. En general, la informacin en la base de datos estar integrada y adems ser compartida. Integrada significa que la base de datos puede considerarse como una unificacin de varios archivos de datos, por lo dems distintos, y que elimina del todo o en parte cualquier redundancia entre ellos. Por ejemplo, cierta base de datos podra tener un archivo de EMPLEADOS, con datos de nombre, domicilio, departamento, salario, etc., y tambin un archivo de INSCRIPCIN, que representara la inscripcin de empleados en cursos de adiestramiento. Supngase que para llevar a cabo el proceso de administracin de los cursos de adiestramiento es preciso conocer el departamento de cada estudiante inscrito. En este caso es evidente que no hace falta incluir esa informacin, de manera redundante, en el archivo INSCRIPCIN, porque siempre podr obtenerse mediante una consulta al archivo EMPLEADOS. Compartida significa que los elementos individuales de informacin en la base de datos pueden compartirse entre varios usuarios distintos, en el sentido de que todos ellos pueden tener acceso al mismo elemento de informacin (y diferentes usuarios pueden utilizarlo para propsitos diferentes). Esta capacidad de compartir (en forma simultnea o no) se desprende en parte de la integracin de la base de datos. En el ejemplo de EMPLEADOS/INSCRIPCIN, los datos de departamento del archivo EMPLEADOS seguramente sern compartidos por los usuarios del

CISI - GDBD2009

14

Tema 1: Conceptos Bsicos de Base de Datos

Departamento de Personal y los Departamentos de Educacin, estos departamentos utilizaran la informacin con diferentes propsitos. Equipo. Los componentes de equipo del sistema son: Los volmenes de almacenamiento secundario - por lo regular discos magnticos de cabeza mvil - donde se conservan los datos almacenados , junto con los dispositivos de E/S asociados (unidades de disco, etc..), controladores de dispositivos, canales de E/S y dems. El procesador o procesadores y la memoria principal asociada que hacen posible la ejecucin de los programas del sistema de bases de datos. Programas. Entre la base de datos fsica misma (los datos y como estn almacenados) y los usuarios del sistema existe un nivel de programas, el manejador de base de datos o, en la mayora de los casos, el sistema de administracin de base de datos (SMBD, database management system). Usuarios. Hay 4 tipos diferentes de usuarios, diferenciados por la forma en que esperan interactuar con el sistema. Usuario Programadores aplicaciones Interaccin con el SBD de Profesionales en computacin que escriben programas de aplicacin usando un lenguaje de programacin (Cobol, Java, C, etc..). donde incorporan llamadas en DML, las cuales tendrn un formato propio del lenguaje. Usuarios sofisticados No escriben programas, escriben sus preguntas en un lenguaje de consultas de BD Usuarios Escriben aplicaciones de BD que no encajan en el marco tradicional de especializados procesamiento de datos; sistemas de diseo ayudados por computadoras, sistemas expertos y basados en conocimiento, entre otros. Usuarios ingenuos Usuarios no sofisticados que interactan con el sistema invocando a uno de los programas de aplicacin. Ejemplo: Transferencia (cajero de un banco).

CISI - GDBD2009

15

Tema 1: Conceptos Bsicos de Base de Datos

4. SISTEMA MANEJADOR DE BASE DE DATOS (SMBD)


Es el conjunto de programas que maneja todo acceso a la base de datos. Un SMBD consiste de un conjunto de datos relacionados entre s y un conjunto de herramientas de software (y/o hardware) para tener acceso a esos datos. Consiste de un conjunto de programas que son usados para definir, procesar y administrar la BD y sus aplicaciones. Conjunto de equipos y programas que organiza los datos y proporciona los mecanismos utilizados para crear un archivo computarizado de BD; aadir, borrar o cambiar datos dentro del archivo; cambiar el modo en que estn almacenados los datos dentro de los archivos de una BD, buscar en la BD aquellos datos que cumplen ciertos criterios, etc.. El SMBD para organizaciones grandes requiere de un gran nmero de personas y altos gastos de equipos, programas y capacitacin personal. Conceptualmente, lo que sucede es lo siguiente: 1.- Un usuario emite una solicitud de acceso utilizando algn lenguaje de manipulacin de datos especfico (DML: Data Manipulation Language). 2.- El SMBD lee la solicitud y la interpreta. 3.-El SMBD inspecciona en orden a) el esquema externo, b) la correspondencia externa / conceptual, c) el esquema conceptual, d) la correspondencia conceptual/interna y e) la definicin de la estructura de almacenamiento. 4.- El SMBD realiza las operaciones necesarias sobre la base de datos almacenada. Un SMBD puede organizar, procesar y presentar los datos seleccionados de una BD. Esta capacidad permite a quienes toman decisiones rastrear, probar y consultar el contenido de la BD para extraer las respuestas a las preguntas no recurrentes y no previstas en informes regulares. El Objetivo primordial de un SMBD es proporcionar un entorno para recuperar informacin y almacenar nueva informacin en la BD de manera segura, y garantizando la integridad de los datos, para lo cual debe proporcionar a los usuarios una visin abstracta de estos, es decir, los detalles de cmo se almacenan y se mantienen los datos, son transparentes para los usuarios. Esto se debe a que muchos de ellos, no tienen experiencia en computadores, por ello se les esconde la complejidad a travs de diversos niveles de abstraccin, para simplificar la interaccin con el sistema.

CISI - GDBD2009

16

Tema 1: Conceptos Bsicos de Base de Datos

4.1.

LAS FUNCIONES DEL SMBD:

En esta seccin se examinaran los tipos de funciones y servicios que debe proporcionar un SMBD. 1) Definicin de datos: El SMBD debe ser capaz de aceptar definiciones de datos (esquema externo, el esquema conceptual, el esquema interno y todas las correspondencias asociadas) en versin fuente y convertirlas en la versin objeto apropiada. Dicho de otro modo, el SMBD debe incluir componentes procesadores de lenguajes para cada uno de los diversos lenguajes de definicin de datos (DDL). 2) Manipulacin de datos: El SMBD debe ser capaz de atender las solicitudes del usuario para extraer, poner al da, datos que ya existen en la base de datos o para agregar en ella datos nuevos. Dicho de otro modo, el SMBD debe incluir componentes procesadores de lenguajes para cada uno de los diversos lenguajes de manipulacin de datos (DML). 3) Seguridad e integridad de los datos: El SMBD debe supervisar las solicitudes de los usuarios y rechazar los intentos de violar las medidas de control y seguridad definidas por el DBA. 4) Control de concurrencia de los datos: El SMBD debe proporcionar un mecanismo para garantizar que la base de datos se actualice correctamente cuando haya varios usuarios actualizando de manera concurrente la base de datos. 5) Recuperacin: El SMBD debe poder recuperar la base de datos en caso de que esta resulte daada de alguna forma. 6) Diccionario de Datos accesible por el usuario: El SMBD debe incluir un catlogo en el que se almacenen las descripciones de los datos y que sea accesible por parte de los usuarios. Un diccionario de datos es un repositorio de informacin que describe los datos contenidos en la base de datos, es decir, datos acerca de los datos o metadatos. Normalmente el diccionario de datos almacena: Los nombres, tipos y tamaos de los elementos de datos Los nombres de las entidades que agrupan los datos Las restricciones de integridad aplicables a los datos Los nombres de usuarios autorizados a acceder a los datos y sus contraseas. Los elementos de datos que cada usuario puede acceder y los tipos de acceso permitido. (insercin, actualizacin, borrado y lectura). Los esquemas externos, conceptual e interno y las correspondencias entre los esquemas.
17

CISI - GDBD2009

Tema 1: Conceptos Bsicos de Base de Datos

Las estadsticas de uso y acceso a los datos.

7) Desempeo: El SMBD debe ejecutar todas las funciones recin identificadas en la forma ms eficiente posible. El SMBD, integra muchos conjuntos de datos que antes se manejaban de manera separada y proporcionan un conjunto completo de programas que sirven como interfaz entre uno o varios usuarios y sus diversas aplicaciones. En un SMBD, los datos se pueden crear, borrar o cambiar en una BD integrada. El trmino integrada se refiere a la capacidad del SMBD de relacionar lgicamente un registro con otro. El usuario tiene acceso directo mediante instrucciones en el teclado. Un SMBD permite entonces: 1. Independencia de los Datos: La independencia de los datos es un objetivo primordial de los sistemas de bases de datos. Esta independencia puede definirse como la inmunidad de las aplicaciones ante los cambios en la estructura de almacenamiento y en la tcnica de acceso, lo cual implica que las aplicaciones en cuestin no dependen de una estructura de almacenamiento o una tcnica de acceso. Todos los datos necesarios pueden ser almacenados en una base general. Si hay que hacer cualquier cambio a los datos pueden efectuarse sin necesidad de cambiar los programas que accedan datos. Esto es posible porque el SMBD proporciona dos aspectos de los datos. La visin fsica de una BD, se relaciona con la localizacin actual de los datos en el dispositivo de almacenamiento. La visin lgica representa los registros. 2. Eliminacin de la redundancia e incremento de la integridad de los datos: Todos los datos relacionados se almacenan en un lugar, si un elemento de los datos debe ser cambiado slo tiene que hacerse en un lugar. 3. Datos integrados, a partir de otros archivos: Un usuario puede recabar datos de cierto nmero de archivos de una base de datos y aplicar esos datos combinados, a reportes u otras aplicaciones, creando relaciones entre los registros. Realza la flexibilidad. 4. Mayor seguridad, a travs del manejo de acceso de datos: La capacidad para negar el acceso a usuarios no autorizados, a datos restringidos, mejora enormemente la seguridad de los datos y pone a salvo la integridad. 5. Normalizacin de reportes y consultas: Un SMBD permite a un usuario que realizar reportes normalizados. Esto permite que el usuario formule preguntas breves.

CISI - GDBD2009

18

Tema 1: Conceptos Bsicos de Base de Datos

4.2.

COMPONENTES FUNCIONALES DEL SISTEMA MANEJADOR DE BASE DE DATOS[2

Los componentes funcionales se pueden dividir a grandes rasgos en componentes de procesamiento de consultas y componentes de gestin de almacenamiento.
Usuario s
Usuarios normales (cajeros, agentes, usuarios Web) Usa Interfaces de aplicacin Usuarios sofisticados (analistas) Usa Herramientas de consulta

Programadores de aplicaciones Escribe Programas de aplicacin

Administrador de Bases de Datos Usa Herramientas de administracin

S M B D

Precompilador del DML Cdigo objeto de los programas de aplicacin Motor de evaluacin de consultas

Consultas DML Compilador del DML

Interprete del DDL

Procesador de Consultas

Gestor de transacciones

Gestor memoria intermedia Gestor de archivos

Gestor de autorizacin e integridad Gestor de almacenamiento

Archivos de Datos

ndices

Datos estadsticos

Diccionario de datos

Almacenamiento en disco

FIGURA # 6. COMPONENTES FUNCIONALES DEL SISTEMA MANEJADOR DE BASE DE DATOS.

Los componentes de procesamiento de consultas incluyen: Compilador DML: Traduce las instrucciones del DML a un plan de evaluacin que consiste en instrucciones de bajo nivel que entiende el Motor de Evaluacin de Consultas. Las consultas del usuario se suelen traducir en varios planes de evaluacin que dan el mismo resultado, para luego elegir el plan de menor costo posible, encontrando as una buena estrategia para ejecutar la consulta. Precompilador DML: Convierte instrucciones en DML incorporadas en un programa de aplicacin en llamadas a procedimientos normales. El precompilador debe interactuar con el compilador DML para generar el cdigo objeto apropiado.
CISI - GDBD2009 19

Tema 1: Conceptos Bsicos de Base de Datos

Intrprete DDL: Interpreta las instrucciones del DDL y las registra en un conjunto de tablas que contiene metadatos, estas tablas se almacenan a continuacin en el catlogo del sistema. Motor de Evaluacin de Consultas: Ejecuta las instrucciones a bajo nivel generadas por el compilador del DML. Los componentes de gestin de almacenamiento proporcionan la interfaz entre los datos de bajo nivel almacenados en la base de datos y los programas de aplicacin y envo de consultas al sistema. El gestor de almacenamiento incluye: Gestor de Transacciones: Asegura que la base de datos quede en un estado consistente (correcto) a pesar de los fallos del sistema, y que las ejecuciones de transacciones concurrentes ocurran sin conflictos. Gestor de Archivos: Gestiona la reserva de espacio de almacenamiento de disco y las estructuras de datos utilizadas para representar la informacin almacenada en disco. Gestor de Memoria Intermedia: Responsable de traer los datos del disco de almacenamiento a memoria principal y decidir qu datos tratar en la memoria cach. Gestor a autorizaciones e integridad: Comprueba que se satisfagan las restricciones de integridad y la autorizacin de los usuarios para tener acceso a los datos. Adems, se necesitan varias estructuras de datos como parte de la implementacin fsica del sistema: Archivos de Datos: Almacenan la BD. Diccionario de Datos: Almacena metadatos (datos acerca de los datos), en particular su esquema. ndices: Proporcionan acceso rpido a elementos de datos que tienen valores particulares, por ejemplo el ndice de este trabajo Datos estadsticos: Almacenan informacin estadstica sobre los datos en la base de datos. El procesador de consultas utiliza esta informacin para seleccionar las formas eficientes para ejecutar una consulta.

CISI - GDBD2009

20

Tema 1: Conceptos Bsicos de Base de Datos

4.3.

VENTAJAS Y LIMITACIONES DE LOS SISTEMAS MANEJADORES DE BASE DE DATOS:


LIMITACIONES

VENTAJAS

Mejor integracin y menos duplicidad de los Se necesitan hardware y software ms datos que se originan en los diferentes complejos y caros. puntos. Menos errores cuando varios registros Fallas del hardware o del software pueden pueden actualizarse en forma simultnea. ocasionar la destruccin de informacin vital de la BD. Ahorran en el costo de desarrollo de nuevas Pueden requerirse un largo perodo de aplicaciones, as como en los costos de conversin, elevados gastos de capacitacin y entrada de los datos y su almacenamiento. habilidades mayores en quienes son responsables del Sistema de BD. Facilitan la organizacin y reorganizacin de la informacin. Facilitan la recuperacin rpida y flexible de la informacin. Facilitan el almacenamiento de grandes cantidades de informacin.

5. ADMINISTRADOR DE BD (DBA: DATABASE ADMINISTRATOR)


Los SMBD y la BD son recursos de la organizacin, los cuales deben administrarse al igual que cualquier otro recurso, el Administrador de Base de Datos ABD, es quien tiene el control sobre estos recursos, y es designado usualmente por la direccin de una compaa y provisto de un personal que trabaje con los usuarios para crear, mantener y salvaguardar los datos en la BD. Asimismo dentro de las organizaciones se cuenta con los Administradores de datos, por lo que es conveniente definir el rol de cada uno: Administrador de Datos: Es la persona que toma las decisiones estratgicas y de polticas con respecto a la informacin de la empresa. Administrador de BD (DBA: database administrator): es la persona que proporciona el apoyo tcnico necesario para poner en prctica las decisiones tomadas por el administrador de datos.

CISI - GDBD2009

21

Tema 1: Conceptos Bsicos de Base de Datos

5.1.

FUNCIONES DEL ABD

Las funciones del ABD incluyen: 1. Definicin del esquema de la BD.

Desarrollo y mantenimiento de un diccionario de datos (DD). EL DD define el significado de cada elemento de datos (cada campo) en la BD; esto incluye los nombres de los datos (nombres de los campos), tipos de datos, tamao del campo y cualquier interrelacin entre elementos de datos. 2. Modificacin del esquema y de la organizacin fsica de la BD: El ABD debe hacer modificaciones en el esquema y en la organizacin fsica para reflejar las necesidades cambiantes de la organizacin, altera la organizacin fsica para mejorar el rendimiento del sistema. 3. Definicin de la estructura de almacenamiento y del mtodo de acceso. 4. Mantenimiento de un control de transacciones: Un control de transacciones contiene una auditoria completa de toda la actividad de una BD en un tiempo. El control ayuda al respaldo, en el caso de que un dato quedar inutilizado o destruido, el control lleva un registro de todos los cambios, que sirve para restaurar la BD a su condicin original. 5. Definicin de las verificaciones de seguridad e integridad : Mediante la concesin de diferentes tipos de autorizacin, el ABD puede regular las partes de la base de datos que puede acceder cada usuario. La informacin de autorizacin se guarda dentro del SMBD y se consulta cada vez que alguien intenta acceder a los datos. 6. Definicin de los procedimientos de respaldo y recuperacin. El DBA debe definir y poner en prctica un plan de recuperacin adecuado que incluya, por ejemplo, el realizar backups peridicos de la base de datos como respaldos y procedimientos para cargar la base de datos a partir del respaldo ms reciente que se tenga. El DBA asegura que se ejecute el respaldo apropiado de la BD. El respaldo se refiere a las copias y al registro de todos los cambios que han sido hechos a la BD. Si sucede algo que dae o destruya la BD; esta puede ser reconstruida (recuperada) usando el respaldo. 7. Supervisin del desempeo y respuesta a los cambios en los requerimientos. Podra ser necesario reorganizar la base de datos en forma peridica con el fin de garantizar que los niveles de desempeo sigan siendo aceptables. Realizar cambios a nivel fsico y actualizar la correspondencia interna - conceptual. 8. Especificacin de las restricciones de integridad, cada vez que hay actualizacin en el sistema.

CISI - GDBD2009

22

Tema 1: Conceptos Bsicos de Base de Datos

6. CONTROL DE SEGURIDAD
La operacin continua exitosa de una empresa con sus operaciones computarizadas demanda: a. Que la dada confidencial est disponible slo para las personas autorizadas, de manera tal que los requerimientos de privacidad sean satisfechos y los secretos de la empresa sean guardados. b. Que la data refleje precisamente el estado de la empresa, esto es, que la data est protegida contra alteraciones o destrucciones accidentales o premeditadas. La informacin ha sido reconocida como un recurso con valor econmico para la empresa y como sucede con otra clase de recursos, la informacin necesita ser protegida y administrada para maximizar su valor. Sin embargo, en contraste con otros bienes tangibles, el valor de la informacin es difcil de cuantificar pero usualmente la informacin crtica puede ser identificada y se pueden tomar medidas contra accesos no autorizados y as asegurar su precisin y disponibilidad. Tan importante como el valor econmico de la informacin es la privacidad de los individuos. El efecto de alterar o revelar informacin de una persona puede ser catastrfico para ella. Por esto que existen tambin razones legales para que una empresa mantenga la seguridad e integridad de su informacin.

6.1.

CONCEPTOS BSICOS DE SEGURIDAD

Seguridad de la informacin: es la proteccin de la informacin contra destruccin, alternacin o revelacin no autorizada. Seguridad de base de datos: es la proteccin de la informacin mantenida en la base de datos. Privacidad: es el derecho que tienen los individuos de controlar la informacin disponible de ellos mismos. Autorizacin: es la especificacin de reglas que definen, para un sujeto, que derechos de acceso tiene sobre que objetos de informador.. Proteccin: en un ambiente computacional son mecanismos de seguridad que se refieren a tcnicas que controlan el acceso de usuarios y programas a la data almacenada. Control de acceso: es el proceso que asegura que la informacin y otros objetos protegidos sean accedidos solamente en formas autorizadas. Polticas de Seguridad: guas y criterios basados en aspectos legales, morales y de organizacin sobre acceso y manipulacin de los datos. Mecanismos de Seguridad: aquellos que permiten programar o implementar las polticas de seguridad

CISI - GDBD2009

23

Tema 1: Conceptos Bsicos de Base de Datos

Existen razones de privacidad, legalidad, confidencialidad, proteccin contra fraudes y secreto para establecer mecanismos que controlen el acceso y manipulacin de la informacin por parte de los usuarios en un ambiente de BD. En un ambiente de BD, se usan mecanismos de seguridad para asegurar que se cumplan las polticas de seguridad exigidas por la organizacin. Existen diferentes modelos en los cuales se pueden basar los mecanismos de seguridad centralizados implementados. Entre ellos tenemos:

6.2.

EL MODELO DE SEGURIDAD BSICO.

En este modelo se definen reglas de acceso que le permiten a un sujeto especifico tener un tipo de acceso determinado sobre algn objeto de la BD. Por esto, una regla de acceso en este modelo se puede ver como una tupla: Ri=(Si,Oi,Ti) Donde la regla Ri define que el sujeto Si tiene derecho acceder el objeto Oi segn el tipo de acceso Ti. Operacionalmente, el conjunto de todas las reglas de acceso se pueden representar a travs de una Matriz de Acceso A [Si, Oi] en donde cada posicin va a tener asociada una lista de tipos de acceso posibles.

CISI - GDBD2009

24

Tema 1: Conceptos Bsicos de Base de Datos

BIBLIOGRAFA

[1] DATE, C.J. Introduccin a los Sistemas de Bases de Datos. Vol I. Quinta Edicin. Addison-Wesley Iberoamericana. 2000. [2] KORTH H., SILBERSCHATZ A. Fundamentos de bases de datos. 5ta Edicin. McGrawHill. 2006. [3] HANSEN & HANSEN. Diseo y Administracin de Base de Datos. 2da. Edicin. 1997. [4] CONNOLLY T. M, BEGG C. E. Sistemas de bases de datos. 4ta Edicin, Pearson educacin S.A., 2005, Di Vasta C., Daz R. Sistemas de Base de datos. ND 2001 -02, Abril 2001.

CISI - GDBD2009

25