Está en la página 1de 16

SISTEMA GESTOR DE BASE DE DATOS

JUAN JOSE RODRIGUEZ ALZATE


ANDRES OCAMPO MEDINA

INSTITUTO COMFAMILIAR
AREA BASE DE DATOS
SEMESTRE 2
BELEN DE UMBRIA
2010
SISTEMA GESTOR DE BASE DE DATOS
Juan José Rodríguez Alzate
Andrés Ocampo Medina

Trabajo presentado al especialista Harold Orlando Peña

INSTITUTO COMFAMILIAR
AREA BASE DE DATOS
SEMESTRE 2
BELEN DE UMBRIA
2010
INTRODUCCION

El término base de datos fue acuñado por primera vez en 1963, en un simposio
celebrado en California.
De forma sencilla podemos indicar que una base de datosno es más que un
conjunto de información relacionada que se encuentra agrupada o estructurada.
El archivopor sí mismo, no constituye una base de datos, sino más bien la forma
en que está organizada la información es la que da origen a la base de datos. Las
bases de datos manuales, pueden ser difíciles de gestionar y modificar. Por
ejemplo, en una guía de teléfonos no es posible encontrar el número de un
individuo si no sabemos su apellido, aunque conozcamos su domicilio.
Del mismo modo, en un archivo de pacientes en el que la información esté
desordenada por el nombre de los mismos, será una tarea bastante engorrosa
encontrar todos los pacientes que viven en una zona determinada. Los problemas
expuestos anteriormente se pueden resolver creando una base de datos
informatizada.
Desde el punto de vista informático, una base de datos es un sistemaformado por
un conjunto de datos almacenados en discos que permiten el acceso directo a
ellos y un conjunto de programas que manipulan ese conjunto de datos.
Desde el punto de vista más formal, podríamos definir una base de datos como un
conjunto de datos estructurados, fiables y homogéneos, organizados
independientemente en máquina, accesibles a tiempo real, compartibles por
usuarios concurrentes que tienen necesidades de información diferente y no
predecibles en el tiempo.
La idea general es que estamos tratando con una colección de datos que cumplen
las siguientes propiedades:
Están estructurados independientemente de las aplicaciones y del soporte de
almacenamiento que los contiene.
Presentan la menor redundancia posible.
Son compartidos por varios usuarios y/o aplicaciones.
JUSTIFICACION

El manejo de bases de datos ha evolucionado de ser una aplicación de


computadora especializada a componente central de un entorno de computación
moderno. Por ello los sistemas de bases de datos han llegado a ser parte esencial
de la formación en ciencias de la computación. Un sistema manejador de bases de
datos consiste en una colección de datos interrelacionados y un conjunto de
programas para acceder a esos datos; cuyo objetivo primordial es proporcionar un
entorno que sea a la vez conveniente y eficiente para ser utilizado al extraer y
almacenar información de la base de datos.
Este curso cubre todos los conceptos fundamentales para el diseño y manejo de
bases de datos, pero se pone especial énfasis en el modelo de datos relacional, el
lenguaje de consultas SQL y el procesamiento de transacciones, así como
también se incluye una parte sobre bases de datos orientadas a objetos.
TABLA DE CONTENIDO

CAPITULO 1.........................................................................................................................4
ARQUITECTURA DE UN SGBD.......................................................................................4
PRODUCTOS SGBD DISPONIBLES EN EL MERCADO.........................................7
SGBD LIBRES..............................................................................................................7
SGBD NO LIBRES.......................................................................................................7
SGBD NO LIBRES Y GRATUITOS...........................................................................8
TIPOS DE BASES DE DATOS......................................................................................9
SEGÚN LA VARIABILIDAD DE LOS DATOS ALMACENADOS..........................9
BASES DE DATOS ESTÁTICAS...........................................................................9
BASES DE DATOS DINÁMICAS...........................................................................9
SEGÚN EL CONTENIDO...........................................................................................9
BASES DE DATOS BIBLIOGRÁFICAS................................................................9
BASES DE DATOS DE TEXTO COMPLETO....................................................10
DIRECTORIOS.......................................................................................................10
BASES DE DATOS O "BIBLIOTECAS" DE INFORMACIÓN QUÍMICA O
BIOLÓGICA.............................................................................................................10
CAPITULO 4...................................................................................................................11
MODELOS DE BASES DE DATOS............................................................................11
BASES DE DATOS JERÁRQUICAS.......................................................................11
BASE DE DATOS DE RED.......................................................................................11
BASES DE DATOS TRANSACCIONALES............................................................12
BASES DE DATOS RELACIONALES....................................................................12
BASES DE DATOS MULTIDIMENSIONALES......................................................13
BASES DE DATOS ORIENTADAS A OBJETOS..................................................13
BASES DE DATOS DOCUMENTALES..................................................................14
BASES DE DATOS DEDUCTIVAS..........................................................................14
GESTIÓN DE BASES DE DATOS DISTRIBUIDA................................................14
CAPITULO 1

ARQUITECTURA DE UN SGBD

Hay tres características importantes inherentes a los sistemas de bases de datos:


la separación entre los programas de aplicación y los datos, el manejo de múltiples
vistas por parte de los usuarios y el uso de un catálogo para almacenar el
esquema de la base de datos. En 1975, el comité ANSI-SPARC (American
National Standard Institute - Standards Planning and Requirements Committee)
propuso una arquitectura de tres niveles para los sistemas de bases de datos, que
resulta muy útil a la hora de conseguir estas tres características.
El objetivo de la arquitectura de tres niveles es el de separar los programas de
aplicación de la base de datos física. En esta arquitectura, el esquema de una
base de datos se define en tres niveles de abstracción distintos:
1. En el nivel interno se describe la estructura física de la base de datos
mediante un esquema interno. Este esquema se especifica mediante un
modelo físico y describe todos los detalles para el almacenamiento de la
base de datos, así como los métodos de acceso.
2. En el nivel conceptual se describe la estructura de toda la base de datos
para una comunidad de usuarios (todos los de una empresa u
organización), mediante un esquema conceptual. Este esquema oculta los
detalles de las estructuras de almacenamiento y se concentra en describir
entidades, atributos, relaciones, operaciones de los usuarios y restricciones.
En este nivel se puede utilizar un modelo conceptual o un modelo lógico
para especificar el esquema.
3. En el nivel externo se describen varios esquemas externos o vistas de
usuario. Cada esquema externo describe la parte de la base de datos que
interesa a un grupo de usuarios determinado y oculta a ese grupo el resto
de la base de datos. En este nivel se puede utilizar un modelo conceptual o
un modelo lógico para especificar los esquemas.
La mayoría de los SGBD no distinguen del todo los tres niveles. Algunos incluyen
detalles del nivel físico en el esquema conceptual. En casi todos los SGBD que se
manejan vistas de usuario, los esquemas externos se especifican con el mismo
modelo de datos que describe la información a nivel conceptual, aunque en
algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y
externo.
Hay que destacar que los tres esquemas no son más que descripciones de los
mismos datos pero con distintos niveles de abstracción. Los únicos datos que
existen realmente están a nivel físico, almacenados en un dispositivo como puede
ser un disco. En un SGBD basado en la arquitectura de tres niveles, cada grupo
de usuarios hace referencia exclusivamente a su propio esquema externo. Por lo
tanto, el SGBD debe transformar cualquier petición expresada en términos de un
esquema externo a una petición expresada en términos del esquema conceptual,
y luego, a una petición en el esquema interno, que se procesará sobre la base de
datos almacenada. Si la petición es de una obtención (consulta) de datos, será
preciso modificar el formato de la información extraída de la base de datos
almacenada, para que coincida con la vista externa del usuario. El proceso de
transformar peticiones y resultados de un nivel a otro se denomina
correspondencia o transformación. Estas correspondencias pueden requerir
bastante tiempo, por lo que algunos SGBD no cuentan con vistas externas.
La arquitectura de tres niveles es útil para explicar el concepto de independencia
de datos que podemos definir como la capacidad para modificar el esquema en un
nivel del sistema sin tener que modificar el esquema del nivel inmediato superior.
Se pueden definir dos tipos de independencia de datos:
 La independencia lógica es la capacidad de modificar el esquema
conceptual sin tener que alterar los esquemas externos ni los programas de
aplicación. Se puede modificar el esquema conceptual para ampliar la base
de datos o para reducirla. Si, por ejemplo, se reduce la base de datos
eliminando una entidad, los esquemas externos que no se refieran a ella no
deberán verse afectados.
 La independencia física es la capacidad de modificar el esquema interno sin
tener que alterar el esquema conceptual (o los externos). Por ejemplo,
puede ser necesario reorganizar ciertos ficheros físicos con el fin de mejorar
el rendimiento de las operaciones de consulta o de actualización de datos.
Dado que la independencia física se refiere sólo a la separación entre las
aplicaciones y las estructuras físicas de almacenamiento, es más fácil de
conseguir que la independencia lógica.
En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el
catálogo o diccionario, de modo que incluya información sobre cómo establecer la
correspondencia entre las peticiones de los usuarios y los datos, entre los diversos
niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar
estas correspondencias haciendo referencia a la información de correspondencia
que se encuentra en el catálogo. La independencia de datos se consigue porque
al modificarse el esquema en algún nivel, el esquema del nivel inmediato superior
permanece sin cambios, sólo se modifica la correspondencia entre los dos niveles.
No es preciso modificar los programas de aplicación que hacen referencia al
esquema del nivel superior.
Por lo tanto, la arquitectura de tres niveles puede facilitar la obtención de la
verdadera independencia de datos, tanto física como lógica. Sin embargo, los dos
niveles de correspondencia implican un gasto extra durante la ejecución de una
consulta o de un programa, lo cual reduce la eficiencia del SGBD. Es por esto que
muy pocos SGBD han implementado esta arquitectura completa.
CAPITULO 2

PRODUCTOS SGBD DISPONIBLES EN EL MERCADO

SGBD LIBRES
 MySQL Licencia Dual, depende el uso (no se sabe hasta cuando, ya que la
compró Oracle). Sin embargo, existen 2 versiones: una gratuita que sería
equivalente a la edición "express" SQL server de Windows y otra más
completa de pago, ese pago se haría en la licencia de ella ya que permitiría
usarse en otras distribuciones sin usar la licencia GNU.
 PostgreSQL (http://www.postgresql.org Postgresql) Licencia BSD
 Firebird basada en la versión 6 de InterBase, Initial Developer's PUBLIC
LICENSE Versión 1.0.
 SQLite (http://www.sqlite.org SQLite) Licencia Dominio Público
 DB2 Express-C (http://www.ibm.com/software/data/db2/express/)
 Apache Derby (http://db.apache.org/derby/)

SGBD NO LIBRES
 Advantage Database
 dBase
 FileMaker
 Fox Pro
 IBM DB2 Universal Database (DB2 UDB)
 IBM Informix
 Interbase de CodeGear, filial de Borland
 MAGIC
 Microsoft Access
 Microsoft SQL Server
 NexusDB
 Open Access
 Oracle
 Paradox
 PervasiveSQL
 Progress (DBMS)
 Sybase ASE
 Sybase ASA
 Sybase IQ
 WindowBase
 IBM IMS Base de Datos Jerárquica
 CA-IDMS

SGBD NO LIBRES Y GRATUITOS


 Microsoft SQL Server Compact Edition Basica
 Sybase ASE Express Edition para Linux (edición gratuita para Linux)
 Oracle Express Edition 10
CAPITULO 3

TIPOS DE BASES DE DATOS

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto


que se esté manejando, o la utilidad de la misma:

SEGÚN LA VARIABILIDAD DE LOS DATOS ALMACENADOS

BASES DE DATOS ESTÁTICAS


Éstas son bases de datos de sólo lectura, utilizadas primordialmente para
almacenar datos históricos que posteriormente se pueden utilizar para estudiar el
comportamiento de un conjunto de datos a través del tiempo, realizar
proyecciones y tomar decisiones.

BASES DE DATOS DINÁMICAS


Éstas son bases de datos donde la información almacenada se modifica con el
tiempo, permitiendo operaciones como actualización, borrado y adición de datos,
además de las operaciones fundamentales de consulta. Un ejemplo de esto puede
ser la base de datos utilizada en un sistema de información de una tienda de
abarrotes, una farmacia, un videoclub.

SEGÚN EL CONTENIDO

BASES DE DATOS BIBLIOGRÁFICAS


Solo contienen un surrogante (representante) de la fuente primaria, que permite
localizarla. Un registro típico de una base de datos bibliográfica contiene
información sobre el autor, fecha de publicación, editorial, título, edición, de una
determinada publicación, etc. Puede contener un resumen o extracto de la
publicación original, pero nunca el texto completo, porque si no, estaríamos en
presencia de una base de datos a texto completo (o de fuentes primarias —ver
más abajo). Como su nombre lo indica, el contenido son cifras o números. Por
ejemplo, una colección de resultados de análisis de laboratorio, entre otras.

BASES DE DATOS DE TEXTO COMPLETO


Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas
las ediciones de una colección de revistas científicas.

DIRECTORIOS
Un ejemplo son las guías telefónicas en formato electrónico.

BASES DE DATOS O "BIBLIOTECAS" DE INFORMACIÓN QUÍMICA O


BIOLÓGICA
Son bases de datos que almacenan diferentes tipos de información proveniente de
la química, las ciencias de la vida o médicas. Se pueden considerar en varios
subtipos:
 Las que almacenan secuencias de nucleótidos o proteínas.
 Las bases de datos de rutas metabólicas.
 Bases de datos de estructura, comprende los registros de datos
experimentales sobre estructuras 3D de biomoléculas-
 Bases de datos clínicas.
 Bases de datos bibliográficas (biológicas, químicas, médicas y de otros
campos): PubChem, Medline, EBSCOhost.
CAPITULO 4

MODELOS DE BASES DE DATOS


Además de la clasificación por la función de las bases de datos, éstas también se
pueden clasificar de acuerdo a su modelo de administración de datos.
Un modelo de datos es básicamente una "descripción" de algo conocido como
contenedor de datos (algo en donde se guarda la información), así como de los
métodos para almacenar y recuperar información de esos contenedores. Los
modelos de datos no son cosas físicas: son abstracciones que permiten la
implementación de un sistema eficiente de base de datos; por lo general se
refieren a algoritmos, y conceptos matemáticos.
Algunos modelos con frecuencia utilizados en las bases de datos:

BASES DE DATOS JERÁRQUICAS


Éstas son bases de datos que, como su nombre indica, almacenan su información
en una estructura jerárquica. En este modelo los datos se organizan en una forma
similar a un árbol (visto al revés), en donde un nodo padre de información puede
tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que
no tienen hijos se los conoce como hojas.
Las bases de datos jerárquicas son especialmente útiles en el caso de
aplicaciones que manejan un gran volumen de información y datos muy
compartidos permitiendo crear estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su incapacidad de
representar eficientemente la redundancia de datos.

BASE DE DATOS DE RED


Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental
es la modificación del concepto de nodo: se permite que un mismo nodo tenga
varios padres (posibilidad no permitida en el modelo jerárquico).
Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una
solución eficiente al problema de redundancia de datos; pero, aun así, la dificultad
que significa administrar la información en una base de datos de red ha significado
que sea un modelo utilizado en su mayoría por programadores más que por
usuarios finales.

BASES DE DATOS TRANSACCIONALES


Son bases de datos cuyo único fin es el envío y recepción de datos a grandes
velocidades, estas bases son muy poco comunes y están dirigidas por lo general
al entorno de análisis de calidad, datos de producción e industrial, es importante
entender que su fin único es recolectar y recuperar los datos a la mayor velocidad
posible, por lo tanto la redundancia y duplicación de información no es un
problema como con las demás bases de datos, por lo general para poderlas
aprovechar al máximo permiten algún tipo de conectividad a bases de datos
relacionales.

BASES DE DATOS RELACIONALES


Éste es el modelo utilizado en la actualidad para modelar problemas reales y
administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970
por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos. Su
idea fundamental es el uso de "relaciones". Estas relaciones podrían considerarse
en forma lógica como conjuntos de datos llamados "tuplas". Pese a que ésta es la
teoría de las bases de datos relacionales creadas por Codd, la mayoría de las
veces se conceptualiza de una manera más fácil de imaginar. Esto es pensando
en cada relación como si fuese una tabla que está compuesta por registros (las
filas de una tabla), que representarían las tuplas, y campos (las columnas de una
tabla).
En este modelo, el lugar y la forma en que se almacenen los datos no tienen
relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto
tiene la considerable ventaja de que es más fácil de entender y de utilizar para un
usuario esporádico de la base de datos. La información puede ser recuperada o
almacenada mediante "consultas" que ofrecen una amplia flexibilidad y poder para
administrar la información.
El lenguaje más habitual para construir las consultas a bases de datos
relacionales es SQL, Structured Query Language o Lenguaje Estructurado de
Consultas, un estándar implementado por los principales motores o sistemas de
gestión de bases de datos relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se le
conoce como normalización de una base de datos.
Durante los años 80 la aparición de dBASE produjo una revolución en los
lenguajes de programación y sistemas de administración de datos. Aunque nunca
debe olvidarse que dBase no utilizaba SQL como lenguaje base para su gestión.

BASES DE DATOS MULTIDIMENSIONALES


Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como
creación de Cubos OLAP. Básicamente no se diferencian demasiado de las bases
de datos relacionales (una tabla en una base de datos relacional podría serlo
también en una base de datos multidimensional), la diferencia está más bien a
nivel conceptual; en las bases de datos multidimensionales los campos o atributos
de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla,
o bien representan métricas que se desean estudiar.

BASES DE DATOS ORIENTADAS A OBJETOS


Este modelo, bastante reciente, y propio de los modelos informáticos orientados a
objetos, trata de almacenar en la base de datos los objetos completos (estado y
comportamiento).
Una base de datos orientada a objetos es una base de datos que incorpora todos
los conceptos importantes del paradigma de objetos:
 Encapsulación - Propiedad que permite ocultar la información al resto de los
objetos, impidiendo así accesos incorrectos o conflictos.
 Herencia - Propiedad a través de la cual los objetos heredan
comportamiento dentro de una jerarquía de clases.
 Polimorfismo - Propiedad de una operación mediante la cual puede ser
aplicada a distintos tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones
sobre los datos como parte de la definición de la base de datos. Una operación
(llamada función) se especifica en dos partes. La interfaz (o signatura) de una
operación incluye el nombre de la operación y los tipos de datos de sus
argumentos (o parámetros). La implementación (o método) de la operación se
especifica separadamente y puede modificarse sin afectar la interfaz. Los
programas de aplicación de los usuarios pueden operar sobre los datos invocando
a dichas operaciones a través de sus nombres y argumentos, sea cual sea la
forma en la que se han implementado. Esto podría denominarse independencia
entre programas y operaciones.
SQL:2003, es el estándar de SQL92 ampliado, soporta los conceptos orientados a
objetos y mantiene la compatibilidad con SQL92.

BASES DE DATOS DOCUMENTALES


Permiten la indexación a texto completo, y en líneas generales realizar búsquedas
más potentes. Tesaurus es un sistema de índices optimizado para este tipo de
bases de datos.

BASES DE DATOS DEDUCTIVAS


Un sistema de base de datos deductiva, es un sistema de base de datos pero con
la diferencia de que permite hacer deducciones a través de inferencias. Se basa
principalmente en reglas y hechos que son almacenados en la base de datos. Las
bases de datos deductivas son también llamadas bases de datos lógicas, a raíz de
que se basa en lógica matemática.

GESTIÓN DE BASES DE DATOS DISTRIBUIDA


La base de datos está almacenada en varias computadoras conectadas en red.
Surgen debido a la existencia física de organismos descentralizados. Esto les da
la capacidad de unir las bases de datos de cada localidad y acceder así a distintas
universidades, sucursales de tiendas, etcétera.

También podría gustarte