Está en la página 1de 11

Introduccion a un DBMS

1. Definiciones bsicas.

Todo buen curso necesita empezar con algunos conceptos bsicos para el mejor
entendimiento del mismo, por lo tanto empezaremos con las definiciones que involucran
a las bases de datos.

Dato:

Conjunto de caracteres con algn significado, pueden ser numricos,


alfabticos, o alfanumricos.

Informacin:

Es un conjunto ordenado de datos los cuales son manejados segn la necesidad


del usuario, para que un conjunto de datos pueda ser procesado eficientemente y pueda
dar lugar a informacin, primero se debe guardar lgicamente en archivos.

Conceptos bsicos de archivos computacionales.

Campo:

Es la unidad ms pequea a la cual uno puede referirse en un programa. Desde


el punto de vista del programador representa una caracterstica de un individuo u objeto.

Registro:

Coleccin de campos de iguales o de diferentes tipos.

Archivo:

Coleccin de registros almacenados siguiendo una estructura homognea.

Base de datos:

Es una coleccin de archivos interrelacionados, son creados con un DBMS. El


contenido de una base de datos engloba a la informacin concerniente (almacenadas en
archivos) de una organizacin, de tal manera que los datos estn disponibles para los
usuarios, una finalidad de la base de datos es eliminar la redundancia o al menos
minimizarla. Los tres componentes principales de un sistema de base de datos son el
hardware, el software DBMS y los datos a manejar, as como el personal encargado del
manejo del sistema.

Administrador de base de datos (DBA):

Es la persona o equipo de personas profesionales responsables del control y


manejo del sistema de base de datos, generalmente tiene(n) experiencia en DBMS,
diseo de bases de datos, Sistemas operativos, comunicacin de datos, hardware y
programacin.

Un poco de historia sobre el origen de Base de datos.

Dada la importancia que tienen en el mundo real las interrelaciones entre los
datos, es imprescindible que la base de datos sea capaz de almacenar stas
interrelaciones, al igual que hace con otros elementos (como las entidades y atributos),
siendo sta una diferencia esencial respecto a los ficheros donde no se almacenan las
interrelaciones.

La redundancia de los datos debe ser controlada, de forma que no existan


duplicidades perjudiciales ni innecesarias, y que las redundancias fsicas, convenientes
muchas veces a fin de responder a objetivos de eficiencia, sean tratadas por el mismo
sistema, de modo que no puedan producirse incoherencias. Por tanto, un dato se
actualizar lgicamente por el usuario de forma nica, y el sistema se preocupar de
cambiar fsicamente todos aquellos campos en los que el dato estuviese repetido, en
caso de existir redundancia fsica.

La actualizacin y recuperacin en las bases de datos debe realizarse mediante


procesos bien determinados, incluidos en un conjunto de programas que se encargan de
la gestin de la base de datos y que se denominan sistemas gestores de bases de
datos (S.G.B.D); procedimientos que han de estar diseados de modo que se mantenga
la integridad, seguridad y confidencialidad de la base.

El concepto de base de datos ha ido cambiando y configurndose a lo largo del


tiempo, en la actualidad, y de acuerdo con estas caractersticas que acabamos de
analizar, podemos definir la base de datos como:

Coleccin o depsito de datos integrados con redundancia controlada y con


una estructura que refleje las interrelaciones y restricciones existentes en el mundo real;
los datos, que han de ser compartidos por diferentes usuarios y aplicaciones, deben
mantenerse independientes de stas, y su definicin y descripcin, nicas para cada tipo
de datos, han de estar almacenadas junto con los mismos. Los procedimientos de
actualizacin y recuperacin comunes y bien determinados, habrn de ser capaces de
conservar la integridad, seguridad y confidencialidad del conjunto de los datos"

2. Caractersticas de las tcnicas de base de datos.

3. Sistema de gestin de base de datos.

El DBMS (DataBase Management System, Sistema de Gestin de DataBase).


Un DBMS es sustancialmente un software que se coloca entre el usuario y los datos
como tales. Gracias a este estrato intermedio el usuario y las aplicaciones no acceden a
los datos tal y como se memorizan efectivamente, es decir a su representacin fsica,
sino que se ve slo una representacin lgica. Esto permite un grado elevado de
independencia entre las aplicaciones y la memorizacin fsica de los datos. El
administrador de la base de datos, si lo necesita, puede decidir memorizar los datos de
un modo diferente o incluso cambiar el DBMS sin que las aplicaciones, es decir los
usuarios, se resientan. Lo importante es que no cambie la representacin lgica de esos
datos, que es la nica cosa que los usuarios conocen.
Esta representacin lgica se conoce como 'Esquema de la base de datos' y es la
forma de representacin de los datos de ms bajo nivel a la que un usuario de la base de
datos puede acceder. Por ejemplo, en la Figura 1 est representada una situacin en la
que el administrador de la base de datos ha decidido que, por motivos de eficacia, era
necesario cambiar el disco en el que se haban memorizado algunos datos,
repartindolos, adems, en ms discos para permitir accesos paralelos a subconjuntos de
datos independientes. Desde el punto de vista del usuario, no ha cambiado
absolutamente nada y probablemente ni siquiera conoce el cambio que se ha producido.

Figura Nro 01.


Caractersticas de un DBMS

La arquitectura de tres niveles definida por el modelo ANSI/SPARC mantiene los


datos y el procesamiento separados. Hablando en general, un DBMS debe tener las
siguientes caractersticas:

Independencia fsica: El nivel fsico puede ser modificado independientemente del


nivel conceptual. Esto significa que el usuario no puede ver todos los componentes
de hardware de la base de datos, que es simplemente una estructura transparente para
representar la informacin almacenada.
Independencia lgica: El nivel conceptual debe poder modificarse sin alterar el
nivel fsico. En otras palabras, el administrador de la base de datos debe poder
introducir mejoras sin afectar la experiencia de los usuarios.
Facilidad de uso: Las personas que no estn familiarizadas con la base de datos
deben poder describir su consulta sin hacer referencia a los componentes tcnicos de
la base de datos.
Acceso rpido: El sistema debe poder responder a las consultas lo ms rpido
posible. Esto requiere algoritmos de bsqueda rpidos.
Administracin centralizada: El DBMS debe permitirle al administrador
manipular los datos, agregar elementos y verificar su integridad de manera
centralizada.
Redundancia controlada: El DBMS debe poder evitar la redundancia de datos
siempre que sea posible, tanto para minimizar los errores como para prevenir el
desperdicio de memoria.
Verificacin de integridad: Los datos deben ser internamente coherentes y, cuando
algunos elementos hacen referencia a otros, estos ltimos deben estar presentes.
Uso compartido de datos: El DBMS debe permitir que mltiples usuarios accedan
simultneamente a la base de datos.
Seguridad de los datos: El DBMS debe poder administrar los derechos de acceso a
los datos de cada usuario.

Los SGBD ms usados son:

ORACLE

Cuando se fund Oracle en 1977 como Software Development Laboratories por


Larry Ellison, Bob Miner y Ed Oates no haba productos de bases de datos
relacionales comerciales. La compaa, cuyo nombre cambi posteriormente
a Oracle, se estableci para construir un sistema de gestin de bases de datos
como producto comercial y fue la primera en lanzarlo al mercado. Desde entonces
Oracle ha mantenido una posicin lder en el mercado de las bases de datos
relacionales, pero con el paso de los aos su producto y servicios ofrecidos han
crecido ms all del servicio de este campo. Aparte de las herramientas
directamente relacionadas con el desarrollo y gestin de bases de datos Oracle
vende herramientas de inteligencia de negocio, incluyendo sistemas de gestin de
bases de datos multidimensionales y un servidor de aplicaciones con una
integracin cercana al servidor de la base de datos.

D2 DE IBM

La familia de productos DB2 Universal Database de IBM consiste en servidores


de bases de datos y un conjunto de productos relacionados. DB2 Universal
Database Server est disponible en muchas plataformas hardware y sistemas
operativos, abarcando desde mainframes (grandes ordenadores centrales) y grandes
servidores a estaciones de trabajo e incluso a pequeos dispositivos de bolsillo. Se
ejecuta en una serie de sistemas operativos IBM y de otras marcas. Everyplace
Edition soporta sistemas operativos tales como PalmOS, Windows CE y otros. Las
aplicaciones pueden migrar fcilmente desde las plataformas de gama baja a
servidores de gama alta. Adems del motor del ncleo de la base de datos, la
familia DB2 consta tambin de varios otros productos que proporcionan
herramientas, administracin, rplicas, acceso a datos distribuido, acceso a datos
generalizados, OLAP y otras muchas caractersticas.

SQL SERVER

De Microsoft, es un sistema gestor de bases de datos relacionales que se usa


desde en porttiles y ordenadores de sobremesa hasta en servidores corporativos,
con una versin compatible, basada en el sistema operativo PocketPC, disponible
para dispositivos de bolsillo, tales como PocketPCs y lectores de cdigo de
barras. SQL Server se desarroll originalmente en los aos 80 en SyBase para
sistemas UNIX y posteriormente pasado a sistemas Windows NT para Microsoft.
Desde 1994 Microsoft ha lanzado versiones de SQL Server desarrolladas
independientemente de Sybase, que dej de utilizar el nombre SQL Server a finales
de los aos 90. La ltima versin disponible es SQL Server 2000, disponible en
ediciones personales, para desarrolladores, estndar y corporativa, y traducida a
muchos lenguajes en todo el mundo. En este captulo el trmino SQL Server se
refiere a todas estas ediciones de SQL Server 2000.

MySQL

MySQL es un sistema gestor de bases de datos (SGBD, DBMS por sus siglas
en ingls) muy conocido y ampliamente usado por su simplicidad y notable
rendimiento. Aunque carece de algunas caractersticas avanzadas disponibles en
otros SGBD del mercado, es una opcin atractiva tanto para aplicaciones
comerciales, como de entretenimiento precisamente por su facilidad de uso y
tiempo reducido de puesta en marcha. Esto y su libre distribucin en Internet bajo
licencia GPL le otorgan como beneficios adicionales (no menos importantes)
contar con un alto grado de estabilidad y un rpido desarrollo.

POSTGRESQL

PostgreSQL es un gestor de bases de datos orientadas a objetos (SGBDOO o


ORDBMS en sus siglas en ingls) muy conocido y usado en entornos de software
libre porque cumple los estndares SQL92 y SQL99, y tambin por el conjunto de
funcionalidades avanzadas que soporta, lo que lo sita al mismo o a un mejor nivel
que muchos SGBD comerciales. El origen de PostgreSQL se sita en el gestor de
bases de datos POSTGRES desarrollado en la Universidad de Berkeley y que se
abandon en favor de PostgreSQL a partir de 1994. Ya entonces, contaba
con prestaciones que lo hacan nico en el mercado y que otros gestores de bases
de datos comerciales han ido aadiendo durante este tiempo.

4. Arquitectura de niveles de un DBMS.

ANSI/SPARC (American National Standard Institute - Standards


Planning and Requirements Committee) es un grupo de normalizacin creado en
1969 para estudiar el impacto de los S.G.B.D. en los sistemas de informacin y cuyos
resultados, publicados en 1975 propusieron el uso de tres niveles de descripcin de
datos:

Nivel interno o fsico. Se refiere al almacenamiento fsico en l se describe cmo


se almacenan realmente los datos en memorias secundarias, en qu archivos, su
nombre y direccin. Tambin estarn los registros, longitud, campos, ndices y las
rutas de acceso a esos archivos.

Nivel Conceptual. En l se describen cules son los datos reales almacenados en la


BD y que relaciones existen entre ellas. Este nivel lo definen los administradores de
la BD que son los que deciden qu informacin se guarda en la BD. Este nivel
corresponde a la estructura organizacional de los datos obtenida al reunir los
requerimientos de todos los usuarios, sin preocuparse de su organizacin fsica ni de
las vas de acceso. Podra contener:
Entidades del mundo real (clientes, artculos, pedidos, ...)
Atributos de las entidades (nombre_cliente, NIF, ...)
Asociaciones entre entidades (compra de artculos)
Restricciones de integridad (son las normas que deben cumplir los datos).

Nivel externo o vistas. Es el nivel ms cercano al usuario y representa la


percepcin individual de cada usuario. Si los niveles interno y conceptual describen
toda la BD, este nivel describe nicamente la parte de datos para un usuario o grupo
de usuarios. Habr usuarios que podrn acceder a ms de un esquema externo y uno
de stos puede ser compartido por varios usuarios, se protege as el acceso a los
datos por parte de personas no autorizadas. A la hora de construir un esquema
externo:
Se pueden omitir una o ms entidades del sistema.
Se pueden omitir uno o ms atributos de una entidad.
Se pueden omitir una o ms relaciones entre los datos.
Se pueden cambiar el orden de los atributos.

Para una BD habr un nico esquema interno, un nico esquema conceptual,


pero puede haber varios esquemas externos.

5. Independencia de datos.

Se refiere a la proteccin contra los programas de aplicacin que puedan


originar modificaciones cuando se altera la organizacin fsica o lgica de la base de
datos. Existen 2 niveles de independencia de datos.

Independencia fsica de datos:


Es la capacidad de modificar el esquema fsico sin provocar que se
vuelvan a escribir los programas de aplicacin.
Independencia lgica de datos:
Capacidad de modificar el esquema conceptual sin provocar que se
vuelvan a escribir los programas de aplicacin

6. Tipos de base de datos (distribuidas, orientada a objetos)

Bases de datos distribuidas

Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos


lgicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios
interconectados por una red de comunicaciones, los cuales tienen la capacidad de
procesamiento autnomo lo cual indica que puede realizar operaciones locales o
distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual
mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones de tal
forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de
lared exactamente como si los datos estuvieran siendo accedidos de forma local.
En un sistema distribuido de bases de datos se almacenan en
varias computadoras. Los principales factores que distinguen un SBDD de un sistema
centralizado son los siguientes:
Hay mltiples computadores, llamados sitios o nodos.
Estos sitios deben de estar comunicados por medio de algn tipo de red de
comunicaciones para transmitir datos y rdenes entre los sitios.

La necesidad de almacenar datos de forma masiva dio paso a la creacin de los


sistemas de bases de datos. En 1970 Edgar Frank Codd escribi un artculo con nombre:
"A Relational Model of Data for Large Shared Data Banks" ("Un modelo relacional
para grandes bancos de datos compartidos"). Con este artculo y otras publicaciones,
defini el modelo de bases de datos relacionales y reglas para poder evaluar un
administrador de bases de datos relacionales.

Bases de Datos Orientadas a Objetos

Las bases de datos orientadas a objetos, tienen una organizacin similar a la de


los rboles. Donde cada nodo del rbol representa un campo y cada rbol un registro,
cada tipo de nodo tiene un mtodo distinto de bsqueda. Que es equivalente a decir que
todos los campos pueden ser utilizados como campos llave, pero complica el diseo. Si
la base de datos es demasiado grande, o tiene relaciones demasiado complejas el grafo
resultante se vuelve una maraa ininteligible. No existen implementaciones comerciales
de este tipo de bases de datos, y los prototipos acadmicos son una capa de software
adicional al manejador de una base de datos relacional.

También podría gustarte