Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BD Und-1b Teoria PDF
BD Und-1b Teoria PDF
¿¿
TEORÍA
BASE DE DATOS
1
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
CONTENIDO
PRIMERA UNIDAD
INTRODUCCION, EVOLUCION DE LAS BASES DE DATOS, SISTEMAS ORIENTADOS A LOS
ARCHIVOS, SISTEMA DE BASE DE DATOS; HARDWARE Y SOFTWARE.
1. INTRODUCCION………………………………………………………………………………………. pag. 03
La necesidad de manejar información ……………………………………………………. Pag. 03
2. EVOLUCION DE LAS BASES DE DATOS…………………………………………………….. pag. 05
3. SISTEMA DE BASE DE DATOS - HARDWARE Y SOFTWARE………………………. pag. 07
4. TIPOS DE BASES DE DATOS……………………………………………………………………. Pag. 09
4.1. Según la variabilidad de los datos almacenados
4.2. Según el contenido
4.3. De acuerdo a su modelo de administración de datos
5. CICLO DE VIDA DE UNA BASE DE DATO (BD)………………………………………….. pag. 11
5.1. Planificación del proyecto.
5.2. Definición del sistema.
5.3. Recolección y análisis de los requisitos.
5.4. Diseño de la base de datos.
5.5. Selección del SGBD.
5.6. Diseño de la aplicación.
5.7. Prototipado.
5.8. Implementación.
5.9. Conversión y carga de datos.
5.10. Prueba.
5.11. Mantenimiento.
6. SISTEMA GESTORES DE BD…………………………………………………………………… pag. 14
Herramientas para manejar la información
Sistema de Gestión de Base de Datos ………………………………………………… pag. 15
Objetivo primordial de un gestor……………………………………………………….. pag. 16
7. COMPONENTES DE LOS SITEMAS GESTORES DE BASE DE DATOS (SGBD) pag. 16
7.1. LENGUAJES DE LOS SGBD: DECLARACIONES DCL; DDL; DML.
7.2. EL DICCIONARIO DE DATOS
7.3. SEGURIDAD E INTEGRIDAD DE LOS DATOS
7.4. EL ADMINISTRADOR DE LA BD
8. DISEÑO E IMPLEMENTACION DE UNA BD…………………………………………… pag. 18
2
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
1. INTRODUCCION
Todas las empresas requieren almacenar información. Desde siempre lo han hecho. La información
puede ser de todo tipo. Cada elemento informativo (nombre, dirección, sueldo, etc.) es lo que se conoce
como dato (en inglés data).
Las soluciones utilizadas por las empresas para almacenar los datos son diversas. Antes de la
aparición de la informática se almacenaban en ficheros con cajones y carpetas y fichas. Tras la aparición
de la informática estos datos se almacenan en archivos digitales dentro de las unidades de
almacenamiento del ordenador (a veces en archivos binarios, o en hojas de cálculo).
Además las empresas requieren utilizar aplicaciones informáticas para realizar tareas propias de la
empresa a fin de mecanizar a las mismas. Estas aplicaciones requieren manejar los datos de la empresa.
En los inicios de la era informática, cada programa almacenaba y utilizaba sus propios datos de
forma un tanto caótica. La ventaja de este sistema (la única ventaja), es que los procesos eran
independientes por lo que la modificación de uno no afectaba al resto. Pero tiene grandes
inconvenientes:
€ Coste de almacenamiento elevado
€ Datos redundantes (se repiten continuamente)
€ Probabilidad alta de inconsistencia en los datos
€ Difícil modificación en los datos y facilidad de problemas de inconsistencia al realizar esas
modificaciones (ya que es difícil que esa modificación afecte a todos los datos).
Lógicamente la solución a este problema es hacer que todas las aplicaciones utilicen los mismos
datos. Esto provoca que los datos deban estar mucho más protegidos y controlados. Además los datos
forman una estructura física y funcional que es lo que se conoce como base de datos.
De esta forma una base de datos es una serie de datos relacionados que forman una estructura
lógica, es decir una estructura reconocible desde un programa informático. Esa estructura no sólo
contiene los datos en sí, sino la forma en la que se relacionan.
Las bases de datos empiezan a aparecer en los años 60 y triunfan en los años setenta y ochenta.
3
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
La lista es muy sencilla, y está detallada por autor del volumen, título, año de publicación, formato en que
lo tenemos disponible en nuestra discoteca (CD es disco compacto, CS es cassette, y LP es disco en vinilo),
y una clasificación propia del estilo de música que contiene.
¿Para qué necesitamos almacenar los datos de esta manera? A lo largo del tiempo hemos ido adquiriendo
más y más discos, y nos gusta intercambiar música con nuestros amigos (como se hacía antes, de forma
inocente y legal, según lo que se entiende por legal hoy en día). Es más práctico dar una lista en papel, o
enviarla por correo electrónico para que éste elija lo que más le guste, en vez de invitarle a casa y que él
se lleve los discos viéndolos directamente en el estante; nuestro amigo también nos proporcionaría su
propia lista para hacer nosotros lo propio.
Precisamente en este punto, cuando la cantidad de discos es grande, hacer dicha lista no es tan fácil.
Podemos pensar que lo normal es comenzar a confeccionarla un día y anotar en ella las nuevas
adquisiciones a medida que van llegando. Más tarde, si alguien nos la pide, podemos fotocopiarla y
proporcionársela.
Sin embargo, es evidente que la lista no está ordenada bajo ningún criterio, salvo si nos hemos tomado la
molestia de, cuando creamos la lista, anotar la información ordenada por autor, por ejemplo. No
obstante, las nuevas entradas de la lista estarán desordenadas puesto que las anotamos al final de esa
lista. Además, con la cantidad de discos que manejamos, es fácil que tengamos descripciones de discos
repetidas, o mal catalogadas, o con el año equivocado; ¿qué hacemos?: ¿un borrón, escribir encima,
escribirla a lápiz para poder borrar y rectificar?
4
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Un día, un amigo nos pide una lista de los discos que tenemos, pero sabemos que lo que le gusta es el
guitarreo y el ruido, lo que nosotros catalogamos como rock, duro, o independiente. La única posibilidad
es darle la lista y que él mismo se busque lo que le interesa.
Cansados de estas limitaciones decidimos utilizar el ordenador. Lo hacemos porque nos permite obtener
listados ordenados por cualquier criterio, mantener la información actualizada, y corregir los errores
fácilmente.
Además, esta información la podemos suministrar de cualquier forma: en papel mediante la salida por
impresora, por correo electrónico, en un fichero de texto en un dispositivo de almacenamiento portátil o,
en definitiva, en cualquier formato de intercambio. Podemos tener copias de seguridad por si se nos
pierde la lista principal. Además, si queremos dar más datos descriptivos de nuestros discos, el ordenador
nos da facilidades para hacerlo sin alterar la información anterior: sólo la definición de los listados se
alterará para poder imprimir, a partir de entonces, los nuevos datos.
Década de 1950
En este lapso de tiempo se da origen a las cintas magnéticas, las cuales sirvieron para suplir las
necesidades de datos de las nuevas industrias. Por medio de este mecanismo se empezó a automatizar
los datos de las nóminas, como por ejemplo el aumento de salario.
5
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Consistía en leer una cinta o más y pasar los datos a otra, y también se podían pasar desde las tarjetas
perforadas. Simulando un sistema de Backup, que consiste en hacer una copia de seguridad o copia de
respaldo, para guardar en un medio extraíble los datos importantes. La nueva cinta a la que se transfiere
los datos pasa a ser una cinta maestra. Estas cintas solo se podían leer secuencial y ordenadamente.
Década de 1960
El uso de los discos en ese momento fue un adelanto muy efectivo, ya que por medio de este soporte se
podía consultar los datos directamente, esto ayudo a ahorrar tiempo. No era necesario saber
exactamente donde estaban los datos en los discos, ya que en milisegundos eran recuperables los datos.
A diferencia de las cintas magnéticas, ya no era necesaria la secuencialidad, y este tipo de soporte
empieza a ser ambiguo.
Los discos dieron inicio a las Bases de Datos, de red y jerárquicas, pues los programadores con su
habilidad de manipulación de estructuras junto con las ventajas de los discos era posible guardar
estructuras de datos como listas y árboles.
Década de 1970
Se definió el modelo relacional y publicó una serie de reglas para la evaluación de administradores de
sistemas de datos relacionales y así nacieron las bases de datos relacionales.
Inicialmente no se usó el modelo relacional debido a que tenía inconvenientes por el rendimiento, ya que
no podían ser competitivas con las bases de datos jerárquicas y de red.
Década de 1980
Las bases de datos relacionales con su sistema de tablas, filas y columnas, pudieron competir con las
bases de datos jerárquicas y de red, ya que su nivel de programación era bajo y su uso muy sencillo.
En esta década el modelo relacional ha conseguido posicionarse del mercado de las bases de datos. Y
también en este tiempo se iniciaron grandes investigaciones paralelas y distribuidas, como las bases de
datos orientadas a objetos.
6
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Siglo XXI
Como respuesta a la creciente complejidad de las aplicaciones que requieren bases de datos, han surgido
dos nuevos modelos: el modelo de datos orientado a objetos y el modelo relacional extendido. Sin
embargo, a diferencia de los modelos que los preceden, la composición de estos modelos no está clara.
Datos de una DB se refiere a archivos, bases de datos, documentos de texto, imágenes y, voz y video
codificados en forma digital.
7
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Un sistema de bases de datos sirve para integrar los datos. Lo componen los siguientes elementos:
Hardware. Máquinas en las que se almacenan las bases de datos. Incorporan unidades de
almacenamiento masivo para este fin.
Software. Es el sistema gestor de bases de datos. El encargado de administrar las bases de datos.
Datos. Incluyen los datos que se necesitan almacenar y los
Metadatos que son datos que sirven para describir lo que se almacena en la base de datos.
Usuarios. Personas que manipulan los datos del sistema. Hay tres categorías:
Usuarios finales. Aquellos que utilizan datos de la base de datos para su trabajo cotidiano
que no tiene por qué tener que ver con la informática. Normalmente no utilizan la base de
datos directamente, si no que utilizan aplicaciones creadas para ellos a fin de facilitar la
manipulación de los datos. Estos usuarios sólo acceden a ciertos datos.
Hay que tener en cuenta que las necesidades de la base de datos de los usuarios son muy
diferentes en función del tipo de usuario que sean:
El almacenero de una empresa solo le interesa todas las compras y saldos de su almacén.
Al planillero de una empresa le interesa las horas que laboran por día para poder elaborar
la planilla semanal con sus horas extras incluidas.
Al dueño de la empresa le interesa cuanto es la utilidad al fin de mes.
Al farmacéutico le interesa saber los medicamentos que se vencen cada mes y rematarlas
para no tener pérdidas.
Al contador de una empresa le interesa la relación de las facturas emitidas y recibidas para
los pagos respectivos a la SUNAT., etc.
Los usuarios también pueden ser para:
Industrias manufactureras,
Hospitales,
Bancos,
Escuelas,
Instituciones Gubernamentales, etc.
Donde para operar se deben tener una gran cantidad de datos como:
Datos de producción,
Información de pacientes ,
Cuentas contables,
Datos de alumnos y profesores,
Censos de población y de recursos
8
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Las bases de datos pueden clasificarse de varias maneras, de acuerdo al criterio elegido para su
clasificación:
Éstas son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos
históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto
de datos a través del tiempo, realizar proyecciones y tomar decisiones.
Éstas son bases de datos donde los datos almacenados se modifican con el tiempo, permitiendo
operaciones como actualización y adición de datos, además de las operaciones fundamentales de
consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de información de
una tienda de abarrotes, una farmacia, un videoclub, la banca, etc.
Solo contienen un representante de la fuente primaria, que permite localizarla. Un registro típico
de una base de datos bibliográfica contiene datos sobre el autor, fecha de publicación, editorial,
asignatura, título, edición, de una determinada publicación, etc. Puede contener un resumen o
extracto de la publicación original, pero nunca el texto completo, porque sino estaríamos en
presencia de una base de datos a texto completo (o de fuentes primarias—ver más abajo). Como su
nombre lo indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de
análisis de laboratorio, entre otras.
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de
una colección de revistas científicas. Un ejemplo son las guías telefónicas en formato electrónico.
Serían aquellas bases de datos que ofrecen el documento completo, no una representación del
mismo.
Numéricas:
Contienen datos de tipo numérico, como un censo o indicadores cuantitativos. Ejemplo:
Censos del INEI, cuadro de indicadores de inflación mensual, etc.
Mixtas:
Combinan ambos tipos de datos, como por ejemplo informes económicos de empresas, datos
geo-económicos, etc.
9
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Son bases de datos que almacenan diferentes tipos de datos provenientes de las ciencias de la vida
o médicas. Se pueden considerar en varios subtipos:
Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de
acuerdo a su modelo de administración de datos.
Un modelo de datos es básicamente una "descripción" de algo conocido como contenedor de datos (algo
en donde se guarda los datos), así como de los métodos para almacenar y recuperar datos de esos
contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la
implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y
conceptos matemáticos.
10
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
11
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
•Examinando documentos, sobre todo aquellos que se utilizan para recoger o visualizar
información.
•Utilizando cuestionarios para recoger información de grandes grupos de usuarios.
En esta etapa hay que asegurarse de que toda la funcionalidad especificada en los requisitos de
usuario se encuentra en el diseño de la aplicación.
Además, habrá que diseñar las interfaces de usuario, aspecto muy importante que se suele ignorar.
El sistema debe ser fácil de aprender, fácil de usar, ser directo y estar ``dispuesto a perdonar''. Si la
interface no tiene estas características, el sistema dará problemas, sin lugar a dudas.
12
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
5.7. Prototipado.
Un prototipo es un modelo de trabajo de las aplicaciones del sistema. El prototipo no tiene toda la
funcionalidad del sistema final, pero es suficiente para que los usuarios puedan utilizar el sistema e
identificar qué aspectos están bien y cuáles no son adecuados, además de poder sugerir mejoras o la
inclusión de nuevos elementos.
Este proceso permite que quienes diseñan e implementan el sistema sepan si han interpretado
correctamente los requisitos de los usuarios.
Esta etapa es imprescindible cuando el sistema que se va a implementar tiene un gran coste, alto
riesgo o utiliza nuevas tecnologías.
5.8. Implementación.
La implementación de la base de datos se realiza mediante las sentencias del lenguaje de definición
de datos (LDD) del SGBD escogido.
Estas sentencias se encargan de crear el esquema de la base de datos, los ficheros en donde se
almacenarán los datos y las vistas de los usuarios.
Partes de estas aplicaciones son transacciones sobre la base de datos, que se implementan mediante
el lenguaje de manejo de datos (LMD) del SGBD.
También se implementan los menús, los formularios para la introducción de datos y los informes de
visualización de datos mediante lenguajes de consultas no procedurales, generadores de informes,
generadores de formularios, generadores de aplicaciones. También se implementan todos los
controles de seguridad e integridad.
13
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
•Mantenimiento y actualización del sistema. Cuando sea necesario, los nuevos requisitos que
vayan surgiendo se incorporarán al sistema, siguiendo de nuevo las etapas del ciclo de vida que se
acaban de presentar.
6. SISTEMA GESTORES DE BD
El SGBD nos facilita un interfaz para introducir nuestra información desde teclado o cualquier otro
periférico que lo permita, y procesar después esa información para obtener informes de cualquier
tipo. Por ejemplo nos puede interesar tener un listado ordenado por autor y otro por tipo de música.
Otro informe puede que sólo tenga la información del autor, título y año de publicación del disco.
La ventaja estriba en que la información sólo la hemos introducido una vez, y es el propio sistema de
gestión de base de datos el que, según nuestras necesidades, se encarga de clasificar esa información
cada vez que le pedimos un listado. Además, si nos hemos equivocado en el año de publicación de un
disco, simplemente lo modificamos y en los siguientes listados ya saldrá corregido. Si quisiéramos
borrar un disco, porque se nos haya perdido o roto, tampoco es un problema: simplemente, cuando
el SGBD vaya a realizar un nuevo listado no se encontrará con ese disco entre los datos que maneja.
Figura 1.2. Ejemplo de consulta a la base de datos mediante una sentencia SQL
14
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Hay muchos tipos de SGBD, pero la mayor parte de los utilizados comercialmente en la actualidad son
relacionales, es decir, se basan en una cierta teoría o forma de representar los datos para implementar
sus herramientas e interfaces, en este caso el modelo relacional. Entendemos por representación de los
datos como la forma en que se presentan al usuario y que permiten ciertas operaciones para poder
manejarlos.
De hecho, en estos SGBD, la información se presenta en forma de tablas (“relación” es el término
formal), con columnas para las características de los objetos o conceptos que pretende representar la
tabla, y filas para cada caso concreto o instancia de objeto. Existe un lenguaje considerado como
estándar para manejar esas tablas, el SQL, que permite crear y modificar tablas, y consultarlas,
introducir nuevos datos, modificar los ya almacenados, o borrarlos.
Al decir que un SGBD es relacional, estamos hablando de que, como mínimo, sigue todas las reglas y
conceptos propuestos por el modelo relacional. El modelo relacional se basa en la teoría de conjuntos y
es, por tanto, un modelo con un fundamento matemático. Este modelo maneja una estructura de datos,
la relación (concepto matemático que se representa “físicamente” como una tabla), y unos operadores
definidos sobre ella.
15
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Una BD es un gran almacén de datos que se define una sola vez; los datos pueden ser accedidos de
forma simultánea por varios usuarios; están relacionados y existe un número mínimo de duplicidad;
además en las BBDD se almacenarán las descripciones de esos datos, lo que se llama metadatos en el
diccionario de datos, que se verá más adelante.
El SGBD es una aplicación que permite a los usuarios definir, crear y mantener la BD y proporciona un
acceso controlado a la misma. Debe prestar los siguientes servicios:
Todos los SGBD ofrecen lenguajes e interfaces apropiadas para cada tipo de usuario: administradores,
diseñadores, programadores de aplicaciones y usuarios finales.
Los lenguajes van a permitir al administrador de la BD especificar los datos que componen la BD, su
estructura, las relaciones que existen entre ellos, las reglas de integridad, los controles de acceso, las
características de tipo físico y las vistas externas de los usuarios. Los lenguajes del SGBD se clasifican
en:
• Lenguaje de definición de datos (LDD o DDL): se utiliza para especificar el esquema de la BD, las
vistas de los usuarios y las estructuras de almacenamiento. Es el que define el esquema conceptual
y el esquema interno. Lo utilizan los diseñadores y los administradores de la BD.
16
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
• Lenguaje de manipulación de datos (LMD o DML): Se utilizan para leer y actualizar los datos de la
BD. Es el utilizado por los usuarios para realizar consultas, inserciones, eliminaciones y
modificaciones. Los hay procedurales, en los que el usuario será normalmente un programador y
especifica las operaciones de acceso a los datos llamando a los procedimientos necesarios. Estos
lenguajes acceden a un registro y lo procesan. Las sentencias de un LMD procedural están
embebidas en un lenguaje de alto nivel lla-mado anfitrión. Las BD jerárquicas y en red utilizan estos
LMD procedurales.
• Lenguaje de control de datos (LCD o DCL): Permiten conceder o suprimir privilegios a los usuarios,
es decir, realiza el control del acceso a los datos. Con este lenguaje se establecen las vistas de los
usuarios, así a cada usuario se le permite manipular únicamente el conjunto de datos que le
interesan, y se le deniega el acceso a los datos que no necesita.
17
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
• Un sistema de seguridad, de modo que los usuarios no autorizados no puedan acceder a la base de
datos.
• Un sistema de integridad que mantiene la integridad y la consistencia de los datos.
• Un sistema de control de concurrencia que permite el acceso compartido a la base de datos.
• Un sistema de control de recuperación que restablece la base de datos después de que se produzca
un fallo del hardware o del software.
• Un diccionario de datos o catálogo, accesible por el usuario, que contiene la descripción de los
datos de la base de datos.
7.4. EL ADMINISTRADOR DE LA BD
En los SGBD existen distintos tipos de usuarios, cada tipo con unos permisos o privilegios
diferentes sobre los objetos que forman la BD.
Instalar el SGBD en el sistema informático.
Crear las BBDD que se vayan a gestionar.
Crear y mantener el esquema de la BD.
Arrancar y parar SGBD y cargar las BBDD con las que se va a trabajar.
Colaborar con el administrador del S.O. En tareas de ubicación, dimensionado y control.
Colaborar en las tareas de formación de usuarios.
Establecer estándares de uso, políticas de acceso y protocolos de trabajo diario.
Suministrar la información necesaria sobre la BD a equipos de análisis y programación.
Efectuar tareas de explotación (resolución de dudas, controlar en tiempo real los accesos,
anomalías etc., copias de seguridad, restauración, auditorias, ajustar y optimizar la BD).
Debemos, antes de nada, darle al SGBD estos conceptos con su correspondiente tipo de datos:
si es un número,
Datos si es una cadena de caracteres,
si es una fecha, etc.
18
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION
TEORIA Semana: 1-2-3-4
Una vez hecho esto, ya podemos introducir los datos de nuestros discos. De la misma forma, una vez que
se han introducido los mismos, podemos realizar consultas sobre los datos almacenados basándonos en
los objetos definidos.
i
Para el profano en la materia es normal denominar al programa de gestión simplemente base de datos. Entiéndase que un
sistema de gestión de bases de datos, el programa, puede manejar una o muchas bases de datos, uno o muchos conjuntos de
información sobre un determinado tema.
19
BASE DE DATOS PRIMERA UNIDAD: BASE DE DATOS E IMPLEMNETACION