Está en la página 1de 1

Introducción a un DBMS

1. Definiciones básicas.
Todo buen curso necesita empezar con algunos
conceptos básicos para el mejor entendimiento del
mismo, por lo tanto empezaremos con las
definiciones que involucran a las bases de datos.
Dato:
Conjunto de caracteres con algún significado,
pueden ser numéricos, alfabéticos, o alfanuméricos.
Información:
Es un conjunto ordenado de datos los cuales son
manejados según la necesidad del usuario, para que
un conjunto de datos pueda ser procesado
eficientemente y pueda dar lugar a información,
primero se debe guardar lógicamente en archivos.
Conceptos básicos de archivos computacionales.
Campo:
Es la unidad más pequeña a la cual uno puede
referirse en un programa. Desde el punto de vista del
programador representa una característica de un
individuo u objeto.
Registro:
Colección de campos de iguales o de diferentes
tipos.
Archivo:
Colección de registros almacenados siguiendo
una estructura homogénea.
Base de datos:
Es una colección de archivos interrelacionados,
son creados con un DBMS. El contenido de una base
de datos engloba a la información concerniente
(almacenadas en archivos) de una organización, de tal
manera que los datos estén disponibles para los
usuarios, una finalidad de la base de datos es eliminar
la redundancia o al menos minimizarla. Los tres
componentes principales de un sistema de base de
datos son el hardware, el software DBMS y los datos
a manejar, así como el personal encargado del manejo
del sistema.
Administrador de base de datos (DBA):
Es la persona o equipo de personas profesionales
responsables del control y manejo del sistema de base
de datos, generalmente tiene(n) experiencia en
DBMS, diseño de bases de datos, Sistemas
operativos, comunicación de datos, hardware y
programación.
Un poco de historia sobre el origen de Base de
datos.
Dada la importancia que tienen en el mundo real
las interrelaciones entre los datos, es imprescindible
que la base de datos sea capaz de almacenar éstas
interrelaciones, al igual que hace con otros elementos
(como las entidades y atributos), siendo ésta una
diferencia esencial respecto a los ficheros donde no se
almacenan las interrelaciones.
La redundancia de los datos debe ser controlada,
de forma que no existan duplicidades perjudiciales ni
innecesarias, y que las redundancias físicas,
convenientes muchas veces a fin de responder a
objetivos de eficiencia, sean tratadas por el mismo
sistema, de modo que no puedan producirse
incoherencias. Por tanto, un dato se actualizará
lógicamente por el usuario de forma única, y el
sistema se preocupará de cambiar físicamente todos
aquellos campos en los que el dato estuviese repetido,
en caso de existir redundancia física.
La actualización y recuperación en las bases de
datos debe realizarse mediante procesos bien
determinados, incluidos en un conjunto de programas
que se encargan de la gestión de la base de datos y
que se denominan sistemas gestores de bases de
datos (S.G.B.D); procedimientos que han de estar
diseñados de modo que se mantenga la integridad,
seguridad y confidencialidad de la base.
El concepto de base de datos ha ido cambiando y
configurándose a lo largo del tiempo, en la
actualidad, y de acuerdo con estas características que
acabamos de analizar, podemos definir la base de
datos como:

“Colección o depósito de datos integrados con


redundancia controlada y con una estructura que
refleje las interrelaciones y restricciones existentes en
el mundo real; los datos, que han de ser compartidos
por diferentes usuarios y aplicaciones, deben
mantenerse independientes de éstas, y su definición y
descripción, únicas para cada tipo de datos, han de
estar almacenadas junto con los mismos. Los
procedimientos de actualización y recuperación
comunes y bien determinados, habrán de ser capaces
de conservar la integridad, seguridad y
confidencialidad del conjunto de los datos"

2. Características de las técnicas de base de datos.

3. Sistemade gestión de base de datos.


El DBMS (DataBase Management System,
Sistema de Gestión de DataBase). Un DBMS es
sustancialmente un software que se coloca entre el
usuario y los datos como tales. Gracias a este estrato
intermedio el usuario y las aplicaciones no acceden a
los datos tal y como se memorizan efectivamente, es
decir a su representación física, sino que se ve sólo
una representación lógica. Esto permite un grado
elevado de independencia entre las aplicaciones y la
memorización física de los datos. El administrador de
la base de datos, si lo necesita, puede decidir
memorizar los datos de un modo diferente o incluso
cambiar el DBMS sin que las aplicaciones, es decir
los usuarios, se resientan. Lo importante es que no
cambie la representación lógica de esos datos, que es
la única cosa que los usuarios conocen.
Esta representación lógica se conoce como
'Esquema de la base de datos' y es la forma de
representación de los datos de más bajo nivel a la que
un usuario de la base de datos puede acceder. Por
ejemplo, en la Figura 1 está representada una
situación en la que el administrador de la base de
datos ha decidido que, por motivos de eficacia, era
necesario cambiar el disco en el que se habían
memorizado algunos datos, repartiéndolos, además,
en más discos para permitir accesos paralelos a
subconjuntos de datos independientes. Desde el punto
de vista del usuario, no ha cambiado absolutamente
nada y probablemente ni siquiera conoce el cambio
que se ha producido.

Figura Nro 01.

Características de un DBMS
La arquitectura de tres niveles definida por el
modelo ANSI/SPARC mantiene los datos y el
procesamiento separados. Hablando en general, un
DBMS debe tener las siguientes características:
• Independencia física: El nivel físico puede ser
modificado independientemente del nivel
conceptual. Esto significa que el usuario no puede
ver todos los componentes de hardware de la base
de datos, que es simplemente una estructura
transparente para representar la información
almacenada.
• Independencia lógica: El nivel conceptual debe

poder modificarse sin alterar el nivel físico. En


otras palabras, el administrador de la base de datos
debe poder introducir mejoras sin afectar la
experiencia de los usuarios.
• Facilidad de uso: Las personas que no estén

familiarizadas con la base de datos deben poder


describir su consulta sin hacer referencia a los
componentes técnicos de la base de datos.
• Acceso rápido: El sistema debe poder responder a

las consultas lo más rápido posible. Esto requiere


algoritmos de búsqueda rápidos.
• Administración centralizada: El DBMS debe

permitirle al administrador manipular los datos,


agregar elementos y verificar su integridad de
manera centralizada.
• Redundancia controlada: El DBMS debe poder

evitar la redundancia de datos siempre que sea


posible, tanto para minimizar los errores como para
prevenir el desperdicio de memoria.
• Verificación de integridad: Los datos deben ser

internamente coherentes y, cuando algunos


elementos hacen referencia a otros, estos últimos
deben estar presentes.
• Uso compartido de datos: El DBMS debe permitir

que múltiples usuarios accedan simultáneamente a


la base de datos.
• Seguridad de los datos: El DBMS debe poder

administrar los derechos de acceso a los datos de


cada usuario.

Los SGBD más usados son:

• ORACLE
Cuando se fundó Oracle en 1977
como Software Development Laboratories por
Larry Ellison, Bob Miner y Ed Oates no había
productos de bases de datos relacionales
comerciales. La compañía, cuyo nombre cambió
posteriormente a Oracle, se estableció para
construir un sistema de gestión de bases de datos
como producto comercial y fue la primera en
lanzarlo al mercado. Desde entonces Oracle ha
mantenido una posición líder en el mercado de las
bases de datos relacionales, pero con el paso de los
años su producto y servicios ofrecidos han crecido
más allá del servicio de este campo. Aparte de las
herramientas directamente relacionadas con el
desarrollo y gestión de bases de datos Oracle
vende herramientas de inteligencia de negocio,
incluyendo sistemas de gestión de bases de datos
multidimensionales y un servidor de aplicaciones
con una integración cercana al servidor de la base
de datos.
• D2 DE IBM

La familia de productos DB2 Universal Database


de IBM consiste en servidores de bases de datos y
un conjunto de productos relacionados. DB2
Universal Database Server está disponible en
muchas plataformas hardware y sistemas
operativos, abarcando desde mainframes (grandes
ordenadores centrales) y grandes servidores a
estaciones de trabajo e incluso a pequeños
dispositivos de bolsillo. Se ejecuta en una serie de
sistemas operativos IBM y de otras marcas.
Everyplace Edition soporta sistemas
operativos tales como PalmOS, Windows CE y
otros. Las aplicaciones pueden migrar fácilmente
desde las plataformas de gama baja a servidores de
gama alta. Además del motor del núcleo de la base
de datos, la familia DB2 consta también de varios
otros productos que proporcionan
herramientas, administración, réplicas, acceso a
datos distribuido, acceso a datos generalizados,
OLAP y otras muchas características.
• SQL SERVER

De Microsoft, es un sistema gestor de bases de


datos relacionales que se usa desde en portátiles y
ordenadores de sobremesa hasta en servidores
corporativos, con una versión compatible, basada
en el sistema operativo PocketPC, disponible para
dispositivos de bolsillo, tales como PocketPCs y
lectores de código de barras. SQL Server se
desarrolló originalmente en los años 80 en SyBase
para sistemas UNIX y posteriormente pasado a
sistemas Windows NT para Microsoft. Desde 1994
Microsoft ha lanzado versiones de SQL Server
desarrolladas independientemente de Sybase, que
dejó de utilizar el nombre SQL Server a finales de
los años 90. La última versión disponible es SQL
Server 2000, disponible en ediciones personales,
para desarrolladores, estándar y corporativa, y
traducida a muchos lenguajes en todo el mundo.
En este capítulo el término SQL Server se refiere a
todas estas ediciones de SQL Server 2000.
• MySQL

MySQL es un sistema gestor de bases de datos


(SGBD, DBMS por sus siglas en inglés) muy
conocido y ampliamente usado por su simplicidad
y notable rendimiento. Aunque carece de algunas
características avanzadas disponibles en otros
SGBD del mercado, es una opción atractiva tanto
para aplicaciones comerciales, como de
entretenimiento precisamente por su facilidad de
uso y tiempo reducido de puesta en marcha. Esto y
su libre distribución en Internet bajo licencia GPL
le otorgan como beneficios adicionales (no menos
importantes) contar con un alto grado de
estabilidad y un rápido desarrollo.
• POSTGRESQL

PostgreSQL es un gestor de bases de datos


orientadas a objetos (SGBDOO o ORDBMS en
sus siglas en inglés) muy conocido y usado en
entornos de software libre porque cumple los
estándares SQL92 y SQL99, y también por el
conjunto de funcionalidades avanzadas que
soporta, lo que lo sitúa al mismo o a un mejor
nivel que muchos SGBD comerciales. El origen de
PostgreSQL se sitúa en el gestor de bases de datos
POSTGRES desarrollado en la Universidad de
Berkeley y que se abandonó en favor de
PostgreSQL a partir de 1994. Ya entonces, contaba
con prestaciones que lo hacían único en el
mercado y que otros gestores de bases de datos
comerciales han ido añadiendo durante este
tiempo.

4. Arquitectura de niveles de un DBMS.

ANSI/SPARC (American National Standard


Institute - Standards Planning and
Requirements Committee) es un grupo de
normalización creado en 1969 para estudiar el
impacto de los S.G.B.D. en los sistemas de
información y cuyos resultados, publicados en 1975
propusieron el uso de tres niveles de descripción de
datos:

❑ Nivel interno o físico. Se refiere al


almacenamiento físico en él se describe cómo se
almacenan realmente los datos en memorias
secundarias, en qué archivos, su nombre y
dirección. También estarán los registros, longitud,
campos, índices y las rutas de acceso a esos
archivos.

❑ Nivel Conceptual. En él se describen cuáles son


los datos reales almacenados en la BD y que
relaciones existen entre ellas. Este nivel lo definen
los administradores de la BD que son los que
deciden qué información se guarda en la BD. Este
nivel corresponde a la estructura organizacional de
los datos obtenida al reunir los requerimientos de
todos los usuarios, sin preocuparse de su
organización física ni de las vías de acceso. Podría
contener:
• Entidades del mundo real (clientes, artículos,
pedidos, ...)
• Atributos de las entidades (nombre_cliente,
NIF, ...)
• Asociaciones entre entidades (compra de
artículos)
• Restricciones de integridad (son las normas
que deben cumplir los datos).

❑ Nivel externo o vistas. Es el nivel más cercano al


usuario y representa la percepción individual de
cada usuario. Si los niveles interno y conceptual
describen toda la BD, este nivel describe
únicamente la parte de datos para un usuario o
grupo de usuarios. Habrá usuarios que podrán
acceder a más de un esquema externo y uno de
éstos puede ser compartido por varios usuarios, se
protege así el acceso a los datos por parte de
personas no autorizadas. A la hora de construir un
esquema externo:
• Se pueden omitir una o más entidades del
sistema.
• Se pueden omitir uno o más atributos de una
entidad.
• Se pueden omitir una o más relaciones entre
los datos.
• Se pueden cambiar el orden de los atributos.

Para una BD habrá un único esquema interno, un


único esquema conceptual, pero puede haber varios
esquemas externos.

5. Independencia de datos.
Se refiere a la protección contra los programas
de aplicación que puedan originar modificaciones
cuando se altera la organización física o lógica de la
base de datos. Existen 2 niveles de independencia de
datos.

Independencia física de datos:


Es la capacidad de modificar el esquema
físico sin provocar que se vuelvan a escribir los
programas de aplicación.
Independencia lógica de datos:
Capacidad de modificar el esquema
conceptual sin provocar que se vuelvan a escribir
los programas de aplicación

6. Tipos
de base de datos (distribuidas, orientada a
objetos)
Bases de datos distribuidas

Una base de datos distribuida (BDD) es un


conjunto de múltiples bases de datos lógicamente
relacionadas las cuales se encuentran distribuidas
entre diferentes sitios interconectados por una
red de comunicaciones, los cuales tienen la capacidad
de procesamiento autónomo lo cual indica que puede
realizar operaciones locales o distribuidas. Un
sistema de Bases de Datos Distribuida (SBDD) es un
sistema en el cual múltiples sitios de bases de datos
están ligados por un sistema de comunicaciones de tal
forma que, un usuario en cualquier sitio puede
acceder los datos en cualquier parte de
lared exactamente como si los datos estuvieran siendo
accedidos de forma local.
En un sistema distribuido de bases de datos se
almacenan en varias computadoras. Los principales
factores que distinguen un SBDD de un sistema
centralizado son los siguientes:
Hay múltiples computadores, llamados sitios o
nodos.
Estos sitios deben de estar comunicados por
medio de algún tipo de red de comunicaciones para
transmitir datos y órdenes entre los sitios.

La necesidad de almacenar datos de forma


masiva dio paso a la creación de los sistemas de bases
de datos. En 1970 Edgar Frank Codd escribió un
artículo con nombre: "A Relational Model of Data for
Large Shared Data Banks" ("Un modelo relacional
para grandes bancos de datos compartidos"). Con este
artículo y otras publicaciones, definió el modelo de
bases de datos relacionales y reglas
para poder evaluar un administrador de bases de datos
relacionales.

Bases de Datos Orientadas a Objetos


Las bases de datos orientadas a objetos, tienen una
organización similar a la de los árboles. Donde cada
nodo del árbol representa un campo y cada árbol un
registro, cada tipo de nodo tiene un método distinto de
búsqueda. Que es equivalente a decir que todos los
campos pueden ser utilizados como campos llave, pero
complica el diseño. Si la base de datos es demasiado
grande, o tiene relaciones demasiado complejas el grafo
resultante se vuelve una maraña ininteligible. No existen
implementaciones comerciales de este tipo de bases de
datos, y los prototipos académicos son una capa de
software adicional al manejador de una base de datos
relacional.

También podría gustarte