Está en la página 1de 36

1

ÍNDICE

2
1. INTRODUCCIÓN

Las bases de datos son el método preferido para el almacenamiento estructurado


de datos. Desde las grandes aplicaciones multiusuario, hasta los teléfonos móviles
y las agendas electrónicas utilizan tecnología de bases de datos para asegurar la
integridad de los datos y facilitar la labor tanto de usuarios como de los
programadores que las desarrollaron.

Desde sus características, pasando por sus aplicaciones hasta llegar a los sistemas
gestores de bases de datos (SGBD o DBMS), los conceptos y la tecnología
asociados son muchos y muy heterogéneos. Sin embargo, es imprescindible
conocer los aspectos clave de cada uno de estos temas para tener éxito en
cualquier proyecto que implique trabajar con bases de datos.
En el entorno del mercado actual, la competitividad y la rapidez de maniobra de
una empresa son imprescindibles para su éxito. Para conseguirlo existe cada vez
una mayor demanda de datos y, por tanto, más necesidad de gestionarlos. Esta
demanda siempre ha estado patente en empresas y sociedades, pero en estos años
se ha disparado debido al acceso multitudinario a las redes integradas en Internet
y a la aparición de los dispositivos móviles que también requieren esa
información.

En informática se conoce como dato a cualquier elemento informativo que tenga


relevancia para un usuario. Desde su nacimiento, la informática se ha encargado
de proporcionar herramientas que faciliten la manipulación de los datos. Antes de
la aparición de las aplicaciones informáticas, las empresas tenían como únicas
herramientas de gestión de datos los ficheros con cajones, carpetas y fichas de
cartón. En este proceso manual, el tiempo requerido para manipular estos datos
era enorme. Pero la propia informática ha adaptado sus herramientas para que los
elementos que el usuario utiliza en cuanto a manejo de datos se parezcan a los
manuales. Por eso se sigue hablado de ficheros, formularios, carpetas,
directorios,….

La clientela fundamental del profesional informático es la empresa. La empresa se


puede entender como un sistema de información formado por diversos objetos: el
capital, los recursos humanos, los inmuebles, los servicios que presta, etc.

3
Los sistemas de información actuales se basan en bases de datos (BD) y sistemas
de bases de datos (SGBD) que se han convertido en elementos imprescindibles de
la vida cotidiana de la sociedad moderna.

En este curso trataremos de dar una visión completa de los conceptos relacionados
con las bases de datos, la relación que existe entre los sistemas de información y
las bases de datos, y los sistemas gestores de bases de datos. En los primeros
capítulos veremos los aspectos involucrados en su aplicación, tipos, ventajas y
desventajas y la visión e independencia de los datos que han ido surgiendo desde
su conceptualización hasta nuestros días.

4
BASES DE DATOS
2. CONTENIDO
2.1 Definición de Base de Datos

Las aplicaciones informáticas de los años sesenta acostumbraban a darse


totalmente por lotes (batch) y estaban pensadas para una tarea muy específica
relacionada con muy pocas entidades tipo.
Cada aplicación (una o varias cadenas de programas) utilizaba ficheros de
movimientos para actualizar (creando una copia nueva) y/o para consultar uno o
dos ficheros maestros o, excepcionalmente, más de dos. Cada programa trataba
como máximo un fichero maestro, que solía estar sobre cinta magnética y, en
consecuencia, se trabajaba con acceso secuencial. Cada vez que se le quería añadir
una aplicación que requería el uso de algunos de los datos que ya existían y de
otros nuevos, se diseñaba un fichero nuevo con todos los datos necesarios
(Algo que provocaba redundancia) para evitar que los programas tuviesen que leer
muchos ficheros.
A medida que se fueron introduciendo las líneas de comunicación, los terminales
y los discos, se fueron escribiendo programas que permitían a varios usuarios
consultar los mismos ficheros on-line y de forma simultánea. Más adelante fue
surgiendo la necesidad de hacer las actualizaciones también on-line.
A medida que se integraban las aplicaciones, se tuvieron que interrelacionar sus
ficheros y fue necesario eliminar la redundancia. El nuevo conjunto de ficheros se
debía diseñar de modo que estuviesen interrelacionados; al mismo tiempo, las
informaciones redundantes (como por ejemplo, el nombre y la dirección de los
clientes o el nombre y el precio de los productos), que figuraban en los ficheros de
más de una de las aplicaciones, debían estar ahora en un solo lugar.
El acceso on-line y la utilización eficiente de las interrelaciones exigían
estructuras físicas que diesen un acceso rápido, como por ejemplo los índices, las
multilistas, las técnicas de hashing, etc.
Estos conjuntos de ficheros interrelacionados, con estructuras complejas y
compartidos por varios procesos de forma simultánea (unos on-line y otros por
lotes), recibieron al principio el nombre de Data Banks, y después, a inicios de los
años setenta, el de Data Bases. Aquí los denominamos bases de datos (BD).

5
2.2 Características generales

Entre las principales características de los sistemas de base de datos podemos


mencionar:
 Concurrencia
 Integridad
 Recuperación
 Seguridad

Integridad: La integridad de la base de datos se refiere a la validez y la


consistencia de los datos almacenados. Normalmente, la integridad se expresa
mediante restricciones o reglas que no se pueden violar. Estas restricciones se
pueden aplicar tanto a los datos, como a sus relaciones, y es el SGBD quien se
debe encargar de mantenerlas.

Seguridad: La seguridad de la base de datos es la protección de la base de datos


frente a usuarios no autorizados. Sin unas buenas medidas de seguridad, la
integración de datos en los sistemas de bases de datos hace que éstos sean más
vulnerables que en los sistemas de ficheros.

Concurrencia: En algunos sistemas de ficheros, si hay varios usuarios que


pueden acceder simultáneamente a un mismo fichero, es posible que el acceso
interfiera entre ellos de modo que se pierda información o se pierda la integridad.
La mayoría de los SGBD gestionan el acceso concurrente a la base de datos y
garantizan que no ocurran problemas de este tipo.

Recuperación: Muchos sistemas de ficheros dejan que sea el usuario quien


proporcione las medidas necesarias para proteger los datos ante fallos en el
sistema o en las aplicaciones. Los usuarios tienen que hacer copias de seguridad
cada día, y si se produce algún fallo, utilizar estas copias para restaurarlos.

En este caso, todo el trabajo realizado sobre los datos desde que se hizo la última
copia de seguridad se pierde y se tiene que volver a realizar. Sin embargo, los
SGBD actuales funcionan de modo que se minimiza la cantidad de trabajo perdido
cuando se produce un fallo.

Entre otras características se encuentran:

Ambiente auto descriptivo de un sistema de base de registro

Un método de base para registro se designa como auto descripción porque no solo
domina la plataforma de datos en sí, sino que los metadatos precisan y representan

6
los datos en las tablas establecidas en la base de los registros. Esta información es
usada por el software DBMS o los beneficiarios de la base de registro si es
preciso. Esta separación de antecedentes e inquisición sobre los datos hace que un
método en la base de registro sea completamente diferente del procedimiento
tradicional establecido en los registros en el cual la definición de los registros es
parte de los esquemas de aplicación.

Aislamiento entre programa y datos

En el procedimiento basado en registros, la disposición de los registros de datos se


determina en los esquemas de aplicación, por lo que si un beneficiario quiere
cambiar la distribución de un archivo, es necesario cambiar todos los esquemas
que aprueban a ese archivo.

Por otro lado, en la orientación de la base de informes, la distribución de datos se


acumula en la nómina del sistema interno y no en las presentaciones del
programa. Por ese motivo un cambio es todo lo que se precisa para cambiar la
distribución de un registro. Este aislamiento entre los esquemas y los datos
igualmente son independientes de los datos del programa interno.

Soporte para múltiples vistas de datos

Una base de datos acepta múltiples vistas de antecedentes. Una vista es un


conjunto de registro de datos, que está precisada y consagrada para los
beneficiarios personales del sistema. Múltiples beneficiarios en el sistema logran
poseer diferentes vistas del sistema. Cada panorama logra contener solo los
antecedentes de interés para un beneficiario o conjunto de usuarios.

Uso compartido de datos y sistema multiusuario

Las técnicas de bases de antecedentes actuales están delineadas para múltiples


interesados. Es decir, permite que numerosos usuarios entren a la misma base de
datos al mismo tiempo. Esta dirección se consigue por medio de funciones
estratégicas de control de multitud. Estas estrategias aseguran que los datos
accedan de forma correcta y que se conserve a la integridad de los datos. El diseño
de técnicas modernas en la base de registros multiusuario es un gran adelanto para
aquello que restringió el acceso de una persona a la vez.

Control de redundancia de datos

En la orientación de la base de registro, cada módulo de datos se acumula en una


sola carpeta en la base de registro. En ciertos casos, existe una abundancia de
datos para optimizar el rendimiento del programa, pero dicha abundancia se
inspecciona mediante la clasificación de aplicaciones y se conserva el mínimo
implantando de este modo es posible delinear la base de registro.

7
Compartir datos

La composición de todos los antecedentes, para una distribución, dentro de una


técnica de base de datos posee numerosas ventajas. En primer lugar, aprueba el
intercambio de los registros entre los empleados y otros individuos que poseen
acceso al programa. En segundo término, les da a los beneficiarios la capacidad de
organizar más información por medio de un conjunto de datos que sería viable sin
la integración.

Aplicación de restricciones de integridad

Los métodos de administración en la bases de datos se obligan a facilitar la


capacidad para definir y emplear ciertas limitaciones para avalar que los usuarios
acceda a una información válida y conserven la integridad de los antecedentes.
Una limitación de base de registro es una restricción que se dicta para poder
ingresar o emitir una tabla, como un código postal que usa un formato establecido
o también para agregar un término legal en el campo.

Existen numerosos tipos de limitaciones en la base de registros. El tipo de datos,


establece el tipo de datos autorizados en un campo, un ejemplo particular, son los
números. La exclusividad de los registros es la clave principal que garantiza el
ingreso duplicado. Las limitaciones logran ser simples, apoyadas en el campo o
complejas de la programación.

Restricción de acceso no autorizado


No todos los beneficiarios de un sistema de registro de datos poseerán los mismos
privilegios de dirección. Por ejemplo, un beneficiario lograría poseer el acceso en
una sola lectura esto hace que la capacidad de leer un registro sea más fluida de
este modo el usuario puede realizar cambios en su tabla de registro. Por este
motivo un sistema de administración en el registro de datos debe suministrar un
subsistema de confianza para establecer y controlar diversos tipos de cuentas del
beneficiario de este modo puede restringir el acceso no autorizado.

2.3 Aplicación

En el mundo real ha sido de gran ayuda este desarrollo tecnologico ya que el


propósito de una base de datos es ayudar a las personas asi como también a las
organizaciones a empresas.
La forma en que ayudan las bases de datos es, llevar un registro de las cosas o
datos importantes que se desean guardar. Y la mayoría de las empresas ya sean
privadas o no privadas hacen uso de ellas.

8
2.3.1 Instituciones Educativas

En las universidades por lo particular cada una de ellas contiene una base de datos
en la cual almacenan información como por ejemplo de las carreras, de los
estudiantes como sus calificaciones, horarios, materias.

El I.U.P “Santiago Mariño” es una de las universidades a la que hago referencia


ya que cuenta con una base de datos y la cual contiene toda esa informacion antes
mencionada.

2.3.2 Aerolíneas

Las aerolíneas como Avior poseen una base de datos en la cual manejan
información ya sea de clientes, horarios, vuelos y destinos.

2.3.3 Instituciones Bancarias

Se llevan operaciones electrónicas que por lo particular hace uso de una bases de
datos en la cual lleva el control y registro acerca de información de clientes,
cuentas, transacciones, prestamos, etc.

2.3.4 Telecomunicaciones

En la actualidad se encuentran varias empresas de telecomunicaciones que cuentas


con una base de datos y las utiliza para guardar registros de llamadas realizadas,
generar facturas mensuales, mantener el saldo de las tarjetas telefónicas de
prepago, almacenar información sobre las redes.

Una de las empresas que cuentan con esta gran herramienta es Movistar.

2.3.5 Centros Comerciales

Los centros comerciales poseen un orden determinado par disponer las tiendas;
por ejemplo, una planta o sector es para el expendio de comida y restaurantes, otro
es para cines y centro de diversión y ocio. Es casi imprescindible que el centro
comercial tenga un supermercado o hipermercado.

2.3.6 Mercado Libre

El mercado libre es el sistema en el que el precio de los bienes o servicios es


acordado por el consentimiento de los vendedores y/o empresarios, mediante las
leyes de la oferta y la demanda, siendo luego bajados a los consumidores. Plaza
vip es un ejemplo podría, reactivarlas compras de los clientes, las empresas
virtuales pueden utilizar programas automáticos de correos que envían

9
recordatorios de compras de navidad, o promociones fuera de temporada, así
como descuentos.

2.3.7 Redes de Comunicación

Google genera ventas por medio de la publicidad de sus productos u ofertas. Los
anuncios contienen por norma general un sistema de respuesta, como una tarjeta
de respuesta de negocios o un número gratuito, se confecciona la base de datos a
partir de esas respuestas, en el caso de servicios comerciales hacen uso de Google.

2.3.8 Instituciones de Gobierno

Institución de gobierno cuyo fin es elaborar políticas de generación y mejora del


empleo, contribuir al desarrollo de pequeñas empresas, así como promover las
normas laborales en la Capital. ICSS (Instituto Colombiano del Seguro Social), es
una institución gubernamental autónoma y tripartita (Estado, patrones y
trabajadores), dedicada a brindar servicios de salud y seguridad social a la
población que cuente con afiliación a la institución

2.4 Modelos

Al igual que cuando se habla, p.ej., de coches no existe un único modelo, ni una
sola marca, ni siquiera una sola tecnología sobre su funcionamiento, cuando se
trabaja con bases de datos ocurre una cosa parecida: no existe una sola marca, sino
varias, y además cada marca puede tener diferentes productos cada uno de ellos
apropiado a un tipo de necesidades.

Sin embargo, la división que vamos a hacer aquí de las bases de datos será en
función de la tecnología empleada en su funcionamiento.

Hablando de coches tenemos los tradicionales de motor a gasolina, los de gasóleo,


los turbodiesel, los que funcionaban con gasógeno, y mucho menos frecuentes los
coches solares o incluso los de propulsión a chorro; pues bien, hablando de bases
de datos tenemos que las más utilizadas son la bases de datos relacionales, las más
antiguas son las
Jerárquicas y en red, y las más avanzadas son las orientadas a objetos, y las
declarativas. Estas se diferencian como hemos dicho, en la forma de trabajar con
los datos y en la concepción o mentalidad que el usuario debe adoptar para
interactuar con el sistema.
Al igual que en el caso de los coches, unos sistemas consumen más recursos que
otros. P.ej., los sistemas declarativos consumen tanta memoria y tiempo de
funcionamiento como queroseno un coche de propulsión a chorro; una base de
datos en red puede resultar tan penosa de manejar como un coche antiguo con

10
gasógeno. En el término medio podemos decir que lo más empleado actualmente
(aunque algunos pueden decir que lo más contaminante) es el sistema relacional,
al igual que los coches de gasolina o gasóleo.
2.4.1 Bases de Datos Jerárquicas

En este modelo los datos se organizan en una forma similar a un árbol (visto al
revés), en donde un nodo padre de información puede tener varios hijos. El nodo
que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los
conoce como hojas.
Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones
que manejan un gran volumen de información y datos muy compartidos
permitiendo crear estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su incapacidad de
representar eficientemente la redundancia de datos.

2.4.2 Bases de Datos en Red

Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental


es la modificación del concepto de nodo: se permite que un mismo nodo tenga
varios padres (posibilidad no permitida en el modelo jerárquico).

Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una
solución eficiente al problema de redundancia de datos; pero, aun así, la dificultad
que significa administrar la información en una base de datos de red ha
significado que sea un modelo utilizado en su mayoría por programadores más
que por usuarios finales.

2.4.3 Bases de Datos Transaccionales

Son bases de datos cuyo único fin es el envío y recepción de datos a grandes
velocidades, estas bases son muy poco comunes y están dirigidas por lo general al
entorno de análisis de calidad, datos de producción e industrial, es importante
entender que su fin único es recolectar y recuperar los datos a la mayor velocidad
posible, por lo tanto la redundancia y duplicación de información no es un
problema como con las demás bases de datos, por lo general para poderlas
aprovechar al máximo permiten algún tipo de conectividad a bases de datos
relacionales.

Un ejemplo habitual de transacción es el traspaso de una cantidad de dinero entre


cuentas bancarias.

11
Normalmente se realiza mediante dos operaciones distintas, una en la que se
decrementa el saldo de la cuenta origen y otra en la que incrementamos el saldo de
la cuenta destino. Para garantizar la atomicidad del sistema (es decir, para que no
aparezca o desaparezca dinero), las dos operaciones deben ser atómicas, es decir,
el sistema debe garantizar que, bajo cualquier circunstancia (incluso una caída del
sistema), el resultado final es que, o bien se han realizado las dos operaciones, o
bien no se ha realizado ninguna.

2.4.4 Bases de Datos Relacionales

Éste es el modelo utilizado en la actualidad para modelar problemas reales y


administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970
por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos. Su
idea fundamental es el uso de
"relaciones". Estas relaciones podrían considerarse en forma lógica como
conjuntos de datos llamados "tuplas". Pese a que ésta es la teoría de las bases de
datos relacionales creadas por Codd, la mayoría de las veces se conceptualiza de
una manera más fácil de imaginar. Esto es pensando en cada relación como si
fuese una tabla que está compuesta por registros (las filas de una tabla), que
representarían las tuplas, y campos (las columnas de una tabla).

2.4.5 Bases de Datos Orientadas a Objetos

Este modelo, bastante reciente, y propio de los modelos informáticos orientados a


objetos, trata de almacenar en la base de datos los objetos completos (estado y
comportamiento).
Una base de datos orientada a objetos es una base de datos que incorpora todos los
conceptos importantes del paradigma de objetos:
 Encapsulación - Propiedad que permite ocultar los datos al resto de los objetos,
impidiendo así accesos incorrectos o conflictos.
 Herencia - Propiedad a través de la cual los objetos heredan comportamiento
dentro de una jerarquía de clases.
 Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a
distintos tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones
sobre los datos como parte de la definición de la base de datos. Una operación
(llamada función) se especifica en dos partes. La interfaz (o signatura) de una
operación incluye el nombre de la operación y los tipos de datos de sus
argumentos (o parámetros). La implementación (o método) de la operación se
especifica separadamente y puede modificarse sin afectar la interfaz. Los
programas de aplicación de los usuarios pueden operar sobre los datos invocando

12
a dichas operaciones a través de sus nombres y argumentos, sea cual sea la forma
en la que se han implementado. Esto podría denominarse independencia entre
programas y operaciones.
Se está trabajando en SQL3, que es el estándar de SQL92 ampliado, que soportará
los nuevos conceptos orientados a objetos y mantendría compatibilidad con
SQL92.

2.4.6 Bases de Datos Documentales

Permiten la indexación a texto completo, y en líneas generales realizar búsquedas


más potentes. Tesauro es un sistema de índices optimizado para este tipo de bases
de datos.

2.5 Tipos

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto


que se esté manejando, la utilidad de las mismas o las necesidades que satisfagan.

2.5.1 Según la Variabilidad de los Datos Almacenados

2.5.1.1 Base de Datos Estáticas


Son bases de datos de sólo lectura, utilizadas primordialmente para almacenar
datos históricos que posteriormente se pueden utilizar para estudiar el
comportamiento de un conjunto de datos a través del tiempo, realizar
proyecciones, tomar decisiones y realizar análisis de datos para inteligencia
empresarial.

2.5.1.2 Base de Datos Dinámicas


Éstas son bases de datos donde la información almacenada se modifica con el
tiempo, permitiendo operaciones como actualización, borrado y adición de datos,
además de la operaciones fundamentales de consulta. Un ejemplo de esto puede
ser la base de datos utilizada en un sistema de información de un supermercado,
una farmacia, un videoclub o una empresa.

2.5.2 Según el Contenido

2.5.2.1 Bases de Datos Bibliográficas

Sólo contienen un subrogante (representante) de la fuente primaria, que permite


localizarla. Un registro típico de una base de datos bibliográfica contiene
información sobre el autor, fecha de publicación, editorial, título, edición, de una

13
determinada publicación, etc. Puede contener un resumen o extracto de la
publicación original, pero nunca el texto completo, porque si no, estaríamos en
presencia de una base de datos a texto completo (o de fuentes primarias —ver más
abajo). Como su nombre lo indica, el contenido son cifras o números. Por
ejemplo, una colección de resultados de análisis de laboratorio, entre otras.

2.5.2.2 Bases de datos de texto completo

Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas
las ediciones de una colección de revistas científicas.

Directorios

Un ejemplo son las guías telefónicas en formato electrónico.

Bases de Datos o "Bibliotecas" de Información Química o Biológica

Son bases de datos que almacenan diferentes tipos de información proveniente de


la química, las ciencias de la vida o médicas. Se pueden considerar en varios
subtipos: Las que almacenan secuencias de nucleótidos o proteínas.

2.5.3 Las Bases de Datos de Rutas Metabólicas.

Bases de datos de estructura, comprende los registros de datos experimentales


sobre estructuras 3D de biomoléculas.

2.5.4 Bases de Datos Clínicas.


Bases de datos bibliográficos (biológicos, químicos, médicos y de otros campos).

2.6 Ventajas y Desventajas

En el mundo actual el manejo de sistemas informáticos y telemáticos se ha vuelto


una obligación, algo inexcusable, imprescindible. Prácticamente que necesitamos
de ellos inclusive para mercar. Pero para que todo ello sea posible se requiere no
sólo de la infraestructura del internet, sino de aquellos hermosos repositorios de
datos conocidos mejor como bases de datos. Pues bien, veamos algunos de sus
beneficios.

2.6.1 Ventajas

 Independencia de los datos respecto a los tratamientos y viceversa: un cambio en


los tratamientos no implica un nuevo diseño lógico y/o físico de la base de datos.
Por otro lado, cambios en la incorporación, desaparición de datos, cambios en la

14
estructura física o caminos de acceso no deben obligar a alterar los programas. Así
se evita la reprogramación de las aplicaciones.
 Coherencia de los resultados: debido a que la información de la base de datos se
almacena en forma unificada y coordinada, en todos los tratamientos se utilizan
los mismos datos, por lo que los resultados de estos son coherentes y
comparables. Así, se reducen las divergencias en los resultados.
 Mejor disponibilidad de los datos para el conjunto de los usuarios: en una base de
datos ningún usuario es propietario de los datos, pues estos se comparten entre las
aplicaciones, existiendo una mayor disponibilidad y transparencia.
 Mayor valor informativo: esto se refiere al concepto de sinergia, en donde el
valor informativo del conjunto de datos es superior a la suma del valor
informativo de los elementos individuales.
 Mejor y más normalizada documentación: la mayoría de los SGBD proporcionan
herramientas para reflejar el contenido semántico de los datos, es decir, incluyen
una descripción de los datos dentro del sistema (meta data).
 Mayor eficiencia en la captura, validación e ingreso de datos al sistema: al no
existir redundancias, los datos se capturan y validan una sola vez aumentando el
rendimiento del proceso previo al almacenamiento.
 Reducción del espacio de almacenamiento: por un lado, la disminución de
redundancias y las técnicas de compactación hacen que disminuya el espacio en
disco. Sin embargo, los diccionarios, referencias, punteros, listas invertidas
también ocupan espacio.

2.6.2 Desventajas

En nuestro mundo actual tenemos acceso informatizado hasta para mercar, y toda
esta infraestructura no sólo requiere de internet, sino de esos repositorios
maravillosos llamados Bases de datos. Sin embargo, con todo su potencial, tienen
algunas cosas y aspectos que no siempre nos harán ser felices, mismos que
analizaremos a continuación.

 Instalación costosa: equipos: nuevas instalaciones o ampliaciones, sistemas


operativos, compiladores, SGBD comerciales, computadores más poderosos, etc.
 Personal especializado: es clave la administración de la base de datos (DBA) y
los diseñadores y programadores se requiere de conocimientos específicos.
 Desfase entre teoría y práctica: muchos ejecutivos asumen que ciertas
funcionalidades de un sistema de base de datos son ya un hecho (informes de
gestión, OLAP) cuando en realidad un SBD es OLTP.
 Implantación larga y costosa: Sucede muchas veces por la calidad de los datos que
manejan las organizaciones.
 Ausencia de estándares: A pesar del estándar SQL2, aún quedan aspectos ciertos
tipos de bases de datos no estandarizados (en la Web, OO, etc.)

15
2.7 Visión de los Datos

Uno de los principales problemas que debe resolver un sistema gestor de base de
datos es, proporcionar a los usuarios una visión abstracta de los datos, de forma
que pueda despreocuparse de los detalles concretos del almacenamiento de la
información.

La abstracción de datos es una técnica o metodología que permite diseñar


estructuras de datos. La abstracción consiste en representar bajo ciertos
lineamientos de formato las características esenciales de una estructura de datos.
Este proceso de diseño evita los detalles específicos de implementación de los
datos.

Un sistema de base de datos mostrará la información que un usuario requiera, la


forma de mostrarla dependerá del usuario mismo, escondiendo la complejidad
(como la forma de tratar los datos, el cómo están almacenados, detalles que el
usuario no necesita conocer) a los usuarios para simplificar su interacción con el
sistema.

Este proceso se realiza a través de varios niveles de abstracción:

2.7.1 Nivel Físico

En este nivel se describen en detalle las estructuras de datos que definen como se
almacenan realmente los datos. Las preocupaciones en este nivel tienen que ver
con tamaño de los registros, uso de la cache, estructuras de los índices, etc.

2.7.2 Nivel Lógico

En este siguiente nivel, lo que se define es que datos se van a almacenar, así como
las relaciones entre los mismos y las restricciones que queremos incluir, tanto a
nivel de valores de los dominios como a condiciones generales que debe cumplir
la base de datos en todo momento. Este nivel permite describir la base de datos
completa en base a un subconjunto de estructuras relativamente simples. La idea
es que los usuarios a nivel lógico (Diseñadores y administradores de bases de
datos) no necesitan preocuparse del nivel físico.

16
2.7.3 Nivel de Vistas

Este nivel completa, mediante la definición de vistas, las necesidades finales de


acceso a los datos. La vista puede reorganizar la información del nivel lógico,
ampliando, transformando o incluso reduciendo la información que se desea
mostrar
al usuario (Programadores y administradores de bases de datos). Además de
esconder los detalles del nivel lógico, las vistas proporcionan un mecanismo de
seguridad que evita los accesos a determinadas partes de la base de datos.

Cabe destacar que los datos almacenados en una base de datos se ven modificados
a lo largo del tiempo, normalmente. Se denomina ejemplar de la base de datos a la
colección de información almacenada en la misma en un momento determinado.
El diseño completo de la base de datos se llama esquema de la base de datos.
Existen diferentes esquemas, de acuerdo con los niveles explicados anteriormente.
Así, el esquema físico describe el diseño final en el nivel físico, mientras que
el esquema lógico lo describe en el nivel lógico. Normalmente, es el esquema
lógico el más importante, ya que afecta de manera importante a los programas de
aplicación. El nivel físico, aunque relevante, se puede alterar en la mayoría de los
casos sin que las aplicaciones se vean afectadas.

2.8 Independencia de Datos

La independencia de datos es una forma de gestión de bases de datos que


mantiene los datos separados de otros programas que podrían usar esos datos. De
forma parecida a una medida adicional de seguridad, esta independencia de datos
se asegura de que la información no pueda ser modificada o reorganizada por
ningún otro programa. De esta manera, los datos se mantienen accesibles pero de
la misma manera permanecerán iguales y no podrán ser dañados por
otras aplicaciones que acceden a ellos. La gestión de bases de datos en un entorno
centralizado se basa en el proceso de la independencia de datos. Mientras que la
transparencia dela información todavía existe al ser accesible a otras aplicaciones
y medios, los datos permanecen en un modo de solo lectura. El proceso de tener
esta consistencia en los datos, hace que el mantenimiento y gestión en general de
una base de datos sea mucho más fácil.

El concepto de independencia de datos es diferente a otro sistema que se refiere a


la dependencia de datos. En esta segunda definición, los datos usados para hacer
funcionar una aplicación son realmente representados en un código fuente para el
programa. La capacidad de los datos para ser modificados por el programa
significa que los datos no son considerados constantes y pueden cambiar tocando
el código fuente o usando el programa de otras maneras para adaptarlo a las
necesidades.

17
Se pueden definir dos tipos de independencia de datos:

2.8.1 Independencia Lógica

Es la capacidad de modificar el esquema conceptual sin tener que alterar los


esquemas externos ni los programas de aplicación. Se puede modificar el esquema
conceptual para ampliar la base de datos o para reducirla.

Por ejemplo, el añadir cuentas de mercado de valores en un sistema bancario.

Son más difíciles de lograr que las independencias físicas, ya que los programas
de aplicación son fuertemente dependientes de la estructura lógica de los datos a
los que acceden.

2.8.2 Independencia Física

Es la capacidad de modificar el esquema interno sin tener que alterar el esquema


conceptual (o los externos). Se refiere sólo a la separación entre las aplicaciones y
las estructuras físicas de almacenamiento.

Por ejemplo, puede ser necesario reorganizar ciertos ficheros físicos con el fin de
mejorar el rendimiento de las operaciones de consulta o de actualización de datos.

2.9 Relación entre los Sistemas de información y las Base de datos

Se define como un conjunto de elementos orientados al tratamiento y


administración de datos de información, organizados y listos para su posterior
uso, generados para cubrir una necesidad u objetivo. Un sistema de información,
obtiene sus datos a través de los siguientes procesos:

 Entrada de información: proceso mediante el cual el sistema de información toma


los datos que se requieren para procesar la información desde entradas manuales o
automáticas.
 Almacenamiento de información: es una de las actividades o capacidades más
importantes que tiene un sistema. A través de esta propiedad el sistema puede
recordar la información guardada en las sesiones o procesos anteriores. Esta
información suele ser guardada en estructuras denominadas como archivos.
 Procesamiento de información: Es la capacidad del sistema de información para
efectuar cálculos de acuerdo con la secuencia de operaciones preestablecidas.
Estos cálculos pueden efectuarse con datos introducidos recientemente en el
sistema o bien con datos que están almacenados.

18
Estas características de los sistemas permiten la transformación de datos fuente en
información que puede ser utilizada para la toma de decisiones, lo que hace
posible que un analizador pueda realizar una proyección para cualquier proyecto
de cualquier ámbito. Las bases de datos tuvieron su origen entre el año 1960 y
1962 cuando se empezaron a usar las máquinas que codificaban la información en
tarjetas perforadas por medio de agujeros.

Cabe destacar que entre los tipos de datos, conseguimos 5 categorías básicas, en
las cuales se encuentran:

 Datos web y redes sociales: Son aquellos que están incluidos en el contenido de
la web y redes sociales.
 Máquina a máquina (machine-to-machine o M2M): Está relacionado a las
tecnologías que permiten la conexión a otros equipos. Este tipo de data se genera
por la información capturada por dispositivos como sensores que capturan
información como temperaturas, velocidad, peso u otro tipo de variable a medir.
Esta información es capturada y luego recibida por un equipo para su posterior
análisis.
 Datos de gran transacción: Son los que comprenden registros de transacciones,
datos de registros detallados de telecomunicación, entre otros. Los cuales se
pueden organizar de forma estructurada o no estructurada.
 Biométricos: Entre los datos biométricos se incluyen huellas digitales, escaneo de
retinas, reconocimiento facial, entre otros. Este tipo de datos es muy utilizado por
las grandes agencias de investigación.
 Generación humana: Por medio de nuestras actividades diarias, generamos datos
que pueden ser registrados día a día (esto incluye llamadas telefónicas, correos
electrónicos, estudios médicos, entre otros).
En relación a estas implicaciones, las bases de datos son herramientas bastante
útiles. Todos los días se generan nuevos datos, los cuales al ser procesados de
manera correcta, generan nueva información en función de crear nuevas
soluciones e innovaciones tecnológicas que nos permiten avanzar hacia un mejor
futuro.

2.9.1 La base de datos de empresa en el sistema de información de RRHH

Establecer qué departamento necesita incrementar su personal con un clic,


conocer cuál es el perfil perfecto para un este puesto de trabajo, identificar quién
merece ser promocionado dentro de la empresa… Estas son algunas de las
funcionalidades que permite la base de datos de empresa aplicada al área de
Recursos Humanos.

Los gestores del capital humano no pueden quedar fuera de la innovación


tecnológica a la que asisten las organizaciones y deben sumarse a las últimas

19
tendencias. En este sentido, el big data es una de las herramientas más poderosas
para optimizar su trabajo.

2.9.2 ¿Qué es una base de datos de empresa?

Una base de datos de empresa es un soporte informático en el que se pueden


almacenar datos de manera estructurada, con la menor redundancia posible.

Esta información está alojada digitalmente en un servidor, de modo que cualquier


miembro de la empresa (según los accesos que se les otorguen) puede consultar
los datos a través de distintos programas informáticos. Todo ello, el soporte, el
servidor y las herramientas de consulta, componen el sistema de información.

A nivel de Recursos Humanos, la base de datos de empresa es un elemento


esencial para el desarrollo correcto de su misión, ya que va a permitir a los
responsables de este departamento organizar de una forma ágil y efectiva toda la
información que tienen de los empleados y el clima laboral, evaluarla y desarrollar
una planificación en función de las necesidades que detecten.

2.9.3 Contenidos de la base de datos de Recursos Humanos

En cuanto a los aspectos que deben incluirse en la base de datos de empresa en


relación con la gestión del capital humano de la organización, los siguientes
puntos son los más comunes en este tipo de inventarios:

 Registro de personal: contiene todos los datos sobre los trabajadores (edad,
antigüedad en la empresa, salario, habilidades, contacto, situación familiar…)

 Registro de cargos: refleja el organigrama de la compañía, especificando las


funciones y puestos que ocupa cada colaborador.

 Registro de secciones: muestra las diferentes áreas de la organización y los


miembros que forman parte de cada una de ellas.

 Registro de remuneración: incluye los datos relativos a los salarios e incentivos


que perciben los empleados y directivos.

 Registro de actividades: recoge la información relativa a las distintas iniciativas


en las que ha participado cada trabajador (programas, proyectos, formación…).

20
2.9.4 Ventajas del big data en Recursos Humanos

En el caso de Recursos Humanos, su implantación supone los siguientes


beneficios:
 Agiliza el trabajo. Al estar almacenadas digitalmente, la información recogida
puede compararse en tiempo real a través de algoritmos preestablecidos,
ahorrando tiempo a los profesionales de RRHH, reduciendo el gasto en papel y
material de oficina y reduciendo los errores que un cálculo manual conllevaría.
 Facilita la interconectividad. Su alojamiento en la red posibilita que cualquier
persona con acceso pueda acceder a la información desde cualquier punto y
momento.
 Permite visibilizar el talento. Gracias a esta herramienta, los responsables del
capital humano pueden conocer qué trabajadores tienen más potencial y en qué
áreas, lo que permite generar políticas de promoción o redistribución de las
plantillas optimizadas.
 Contribuye a identificar a los líderes. En el mismo sentido, una evaluación de
los datos registrados en el big data dará a conocer las habilidades de liderazgo de
los diferentes trabajadores.
 Determina las necesidades laborales. Con este soporte, las empresas pueden
descubrir de forma sencilla qué áreas necesitan ser reforzadas o cuáles son los
puestos de trabajo que se necesitan cubrir, contribuyendo a establecer un plan de
contratación que responda a las demandas reales y definiendo el perfil adecuado
en los procesos de reclutamiento y selección de personal.
 Fomenta la satisfacción de la plantilla. Dado que las decisiones a nivel de
personal se basan en un análisis objetivo de los datos, los profesionales sentirán
que las medidas adoptadas son más justas y equitativas, por lo que estarán más
satisfechos y motivados.
 Mejora la rentabilidad de la compañía. Todas estas ventajas suponen, como
consecuencia, un mejor funcionamiento del departamento de Recursos Humanos
que se traduce en un incremento de los beneficios económicos de la organización.

2.10 Sistemas de gestión de bases de datos (SGBD)

La aparición de los SGBD fue fruto de la necesidad de cambiar el concepto de


almacenamiento de datos. Antes de los SGBD (década de los setenta), la
información se trataba y se gestionaba utilizando los típicos sistemas de gestión de
archivos que iban soportados sobre un sistema operativo. Éstos consistían en
conjunto de programas que definían y trabajaban sus propios datos. Este sistema
presentaba diferentes inconvenientes:
 Redundancia e inconsistencia de los datos.
 Dificultad para tener acceso a los datos.

21
 Separación y aislamiento de los datos.
 Problemas en la seguridad de los datos.

Pero quizá el mayor problema que presentaba la gestión de archivos era la


dependencia de la estructura del fichero con el programa. Puesto que la estructura
del fichero dependía directamente del programa que lo gestionaba, en el momento
que se cambiara esa estructura había que adaptar el propio programa y volver a
compilar, lo que entonces llevaba largo tiempo.

Tradicionalmente, para manipular grandes cantidades de datos aparecieron en


primer lugar las bases de datos o "bancos de datos", cumpliendo de manera
aproximada con la definición presentada en el apartado anterior. Se trataba de
almacenar ordenadamente datos en un juego de ficheros, y, mediante unas
aplicaciones informáticas y un sistema de índices, gestionarlas adecuadamente.

Al aumentar la complejidad de estos bancos de datos (elevado número de ficheros


y usuarios, acceso múltiple y simultáneo a los ficheros, aumento del número de
registros, etc.) se producen problemas cada vez más graves para asegurar la
consistencia, la integridad y la accesibilidad de los datos, produciendo problemas
de eficiencia en el tratamiento de los datos. Para resolver estos problemas
aparecen en el mercado los Sistemas de Gestión de Bases de Datos (SGBD), que
convierten el acceso a los datos y su gestión en una aplicación cerrada ("caja
negra"), interponiéndose entre los usuarios y los ficheros, y haciéndose cargo de
todos los problemas de explotación, mantenimiento y comprobación de los datos.

De esta manera el usuario pierde de vista todos los detalles relativos al


almacenamiento físico de los de los datos tratando con ellos sólo a través de un
lenguaje conceptual sencillo.

De acuerdo con los estudios de un grupo de trabajo de ANSI (TSICHRITZIS,


Dennis & KLUG, Anthony C., 1978) los sistemas de gestión de bases de datos se
organizan en tres niveles:

 Nivel interno: manipulación física de los datos. El usuario pierde de vista


totalmente cómo y dónde se almacenan los datos, ocupándose el motor del
sistema de gestión de todas estas tareas
 Nivel externo: visión del usuario: manipulación lógica de los datos. El usuario
maneja la base de datos a través de un entorno organizado mediante menús o
aplicaciones informáticas que le guían sin necesidad de conocimientos de la
estructura de la base de datos
 Nivel intermedio: descripción de la base de datos mediante un lenguaje
conceptual que permiten una visión abstracta del sistema. Se entiende por

22
lenguaje conceptual un lenguaje formado por palabras (comandos) de fácil
memorización que permiten efectuar todas las tareas de acceso y manipulación de
los datos, así como las tareas de mantenimiento de todo el sistema de gestión. El
lenguaje conceptual del sistema de gestión permite abordar de manera todas las
tareas para el mantenimiento y explotación del sistema de gestión. Pueden
agruparse en tres clases:
 Funciones de definición:
 Creación, modificación o eliminación de tablas, registros, campos, índices, etc.
 Creación de relaciones.
 Validación de campos, valores, etc.
 Funciones de manipulación:
Acceso a los datos mediante operaciones de búsqueda condicionada con uso de
operadores lógicos (=, <>, <,> and, or, etc.) para la presentación, modificación o
eliminación de registros.
 Funciones de administración:
 Figura del administrador de la base de datos, con privilegios para otorgar los
permisos de acceso y uso.
 Organización del sistema de permisos de acceso a las tablas, registros, campos,
etc. En los sistemas de gestión de bases de datos aparece la figura del
“administrador” de la base de datos, usuario especial, propietario del sistema, que
decide quién conecta a la base de datos, quién accede a las diferentes tablas y qué
puede hacer en ellas (sólo leer, insertar, modificar o borrar registros, campos,
índices, tablas, etc.). Esta figura es de una enorme importancia para la
preservación de la integridad de los datos.
 Realización de copias de seguridad y recuperación del sistema en caso de desastre.
 Migración del sistema a nuevas versiones o incluso a diferentes sistemas de
gestión.
 Comunicación con otros sistemas de gestión externos (remotos o en la misma
máquina).
 Preprocesadores para la inclusión del lenguaje conceptual en el código fuente de
programas de ordenador como FORTRAN, C, etc. para la programación de tareas
sofisticadas.
 Lenguaje de 4ª generación para la creación de interfaces gráficas de usuario
(menús)

2.10.1 Características fundamentales de un Sistema de Gestión de Base de Datos


(SGBD)

Cada SGBD soporta un modelo lógico, siendo los más comunes el relacional, el
de red y el jerárquico. Estos modelos representan los datos valiéndose de

23
estructuras de registros, por lo que también se denominan modelos orientados a
registros. Hay una nueva familia de modelos lógicos, son los modelos orientados a
objetos, que están más próximos a los modelos conceptuales.
Los modelos físicos describen cómo se almacenan los datos en el ordenador: el
formato de los registros, la estructura de los cheros (desordenados, ordenados,
etc.) y los métodos de acceso utilizados (índices, etc.).

A la descripción de una base de datos mediante un modelo de datos se le


denomina esquema de la base de datos. Este esquema se especifica durante el
diseño, y no es de esperar que se modifique a menudo. Sin embargo, los datos que
se almacenan en la base de datos pueden cambiar con mucha frecuencia: se
insertan datos, se actualizan, etc. Los datos que la base de datos contiene en un
determinado momento se denominan estado de la base de datos u ocurrencia de la
base de datos.

La distinción entre el esquema y el estado de la base de datos es muy importante.


Cuando definimos una nueva base de datos, sólo especificamos su esquema al
SGBD. En ese momento, el estado de la base de datos es el estado vacío", sin
datos. Cuando se cargan datos por primera vez, la base datos pasa al estado
inicial". De ahí en adelante, siempre que se realice una operación de actualización
de la base de datos, se tendrá un nuevo estado. El SGBD se encarga, en parte, de
garantizar que todos los estados de la base de datos sean estados válidos que
satisfagan la estructura y las restricciones especificadas en el esquema. Por lo
tanto, es muy importante que el esquema que se especifique al SGBD sea correcto
y se debe tener muchísimo cuidado al diseñarlo. El SGBD almacena el esquema
en su catálogo o diccionario de datos, de modo que se pueda consultar siempre
que sea necesario.

Un SGBD permite el almacenamiento, manipulación y consulta de datos


pertenecientes a una base de datos organizada en uno o varios ficheros. En el
modelo más extendido (base de datos relacional) la base de datos consiste, de cara
al usuario, en un conjunto de tablas entre las que se establecen relaciones. A pesar
de sus semejanzas (ambos manejan conjuntos de tablas) existen una serie de
diferencias fundamentales entre un SGBD y un programa de hoja de cálculo, la
principal es que un SGBD permite:
 El método de almacenamiento y el programa que gestiona los datos (servidor) son
independientes del programa desde el que se lanzan las consultas (cliente).
 En lugar de primarse la visualización de toda la información, el objetivo
fundamental es permitir consultas complejas, cuya resolución está optimizada,
expresadas mediante un lenguaje formal.
 El almacenamiento de los datos se hace de forma eficiente aunque oculta para el
usuario y normalmente tiene, al contrario de lo que ocurre con las hojas de

24
cálculo, poco que ver con la estructura con la que los datos se presentan al
usuario.
 El acceso concurrente de múltiples usuarios autorizados a los datos, realizando
operaciones de actualización y consulta de los mismos garantizando la ausencia de
problemas de seguridad (debidos a accesos no autorizados) o integridad (pérdida
de datos por el intento de varios usuarios de acceder al mismo fichero al mismo
tiempo.

El programa servidor suele activarse al arrancar el ordenador, podría compararse a


un bibliotecario que recibe peticiones (consultas) de diferentes programas clientes
de base de datos, consulta la base de datos y entrega al cliente el resultado de la
consulta realizada. Si dos usuarios solicitan al mismo tiempo una modificación de
los datos, el programa servidor se encarga de hacerlas ordenadamente para evitar
perder datos (lo que ocurriría si ambos usuarios abrieran y modificaran a la vez un
fichero con la base de datos.

El diseño de una base de datos implica codificar en formato digital ciertos


aspectos del mundo real. Esta codificación implica 3 pasos:

 Modelo conceptual.
 Modelo lógico.
 Modelo digital o implementación física de la base de datos.

2.10.2 Base de Datos Relacional

La base de datos relacional supuso un gran avance frente a las base de datos
jerárquicas y en red porque, así como en estas las relaciones están fijadas en la
estructura de los datos, en el enfoque relacional las relaciones se establecen de una
manera mucho más libre. El esquema relacional fue pensado por Codd a finales de
los años sesenta a partir de la teoría de conjuntos.

Los datos que han de almacenarse en una base de datos pueden agruparse en
conjuntos de datos de la misma naturaleza. El conjunto de todos los datos de un
mismo tipo se denomina ‘dominio’. Los dominios son conjuntos finitos de datos.

Dado unos dominios D1, D2,....Dn, se define una ‘relación’ o ‘entidad’ como
cualquier conjunto de datos d1, d2,....dn, tales que d1 ∈ D1, d2 ∈ D2,.... dn ∈ Dn.
Este conjunto de datos se define como una ‘tupla’. Cada uno de los componentes
de la relación pertenecientes a los dominios se denomina ‘atributos’ de la relación.
Se define como ‘grado’ de la relación el número de atributos (n). La relación
estará formada por un cierto número de tuplas, que se define como ‘cardinalidad’
de la relación.

25
Este lenguaje teórico puede sustituirse por otro más matemático:
Una relación o entidad es una tabla rectangular formada por filas y columnas,
donde cada columna contiene un tipo de dato. Cada fila o registro es una tupla, y
cada columna o campo es un atributo. El número de columnas es el grado y el
número de registros es la cardinalidad.

Para que una tabla pueda considerarse relación de una base de datos relacional
tiene que cumplir una serie de requisitos:

 Debe haber un único valor en cada elemento de las filas (intersección fila –
columna)
 Los valores de todos los elementos de una columna deben ser del mismo tipo
(deben pertenecer al mismo dominio)
 No puede haber dos filas con todos los elementos iguales
 El nombre de cada columna (atributo) debe ser distinto dentro de la tabla
 El valor de los elementos dentro de cada columna debe ser independiente del
orden de las columnas
 El valor de los elementos de las filas debe ser independiente del orden de las filas
Como todas las filas de una tabla tienen que ser distintas, cualquiera de ellas
puede identificarse siempre por el valor de uno o varios campos. A este conjunto
de campos se le llama ‘clave primaria’, que puede ser simple, si la constituye un
solo campo, o compuesta, si la constituyen varios. Ha de intentarse que este grupo
sea mínimo por motivos de eficiencia. Los campos que no pertenecen a la clave
primaria se llaman campos pertenecientes a clave ajena, o campos ‘no clave’.
Obviamente una clave primaria nunca puede tener un valor nulo.

Dentro de una relación o tabla se pueden hacer algunas operaciones básicas:

 Proyección. Se realiza una proyección cuando se extrae un cierto número de


columnas de una tabla
 Selección. Se realiza una selección cuando se extrae un cierto número de filas de
una tabla. Entre tablas, también se pueden efectuar operaciones algebraicas:
 Unión. Se pueden unir dos tablas con el mismo grado (número de columnas) y
mismos atributos: el resultado es una tabla única con los registros de ambas.
 Diferencia. Se obtiene una tabla con los registros que no coinciden en ambas.
 Intersección. Se obtiene una tabla con los registros comunes.
 Producto. Se puede realizar con dos tablas con los mismos atributos Se obtiene
una tabla con el producto cartesiano de los atributos.

Se dice que dos campos A y B tienen dependencia funcional cuando el valor del
campo A es determinado de manera única por el valor de B. Se dice que dos

26
campos A y C tienen dependencia transitiva cuando el valor de B tiene
dependencia funcional de A y C dependencia funcional de B.

Una de las características más sobresalientes de las bases de datos relacionales es


que se pueden establecer interrelaciones entre tablas. No se debe confundir el
concepto de interrelación con el de relación (la confusión proviene de los términos
ingleses relationship y relation). Para poder interrelacionar tablas basta con que
compartan algún campo clave. La interrelación se produce siempre entre un
campo clave en una tabla el mismo campo, pero no clave, en otra tabla.

2.10.3 Diccionario de Datos

Es un listado organizado de todos los objetos de datos pertinentes para el sistema.


La información contenida en él deberá incluir aquellas características que
describan e identifiquen cada objeto de datos. Las anotaciones, métodos y
herramientas utilizadas para desarrollar este apartado deberán estar
estandarizadas. Son desarrollados durante el análisis de flujo de datos y ayuda a
los analistas a tener un mejor interpretación en la determinación de los
requerimientos del sistema

En un diccionario de datos se encuentra la lista de todos los elementos que forman


parte del flujo de datos de toda la base de datos. Los elementos más importantes
son flujos de datos, almacenes de datos y procesos. El diccionario de datos guarda
los detalles y descripción de todos estos elementos.

Estos diccionarios se desarrollan durante el análisis de flujo de datos y ayuda a los


analistas que participan en la determinación de los requerimientos del sistema, su
contenido también se emplea durante el diseño del proyecto.

Proporciona información acerca de:


 La estructura lógica y física de la BD.
 Las definiciones de todos los objetos de la BD: tablas, vistas, índices
 El espacio asignado y utilizado por los objetos.
 Los valores por defecto de las columnas de las tablas.
 Información acerca de las restricciones de integridad.
 Los privilegios y roles otorgados a los usuarios.

Además debe cumplir con las siguientes características:

 Debe soportar las descripciones de los modelos conceptual, lógico, interno y


externo de la BD.

27
 Debe ser integrado dentro del SGBD.
 Debe apoyar la transferencia eficiente de la información al SGBD. - Debe reflejar
los cambios en la descripción de la BD.
 Debe estar almacenado en un medio de almacenamiento con acceso directo para
la fácil recuperación de información.

2.10.4 Estructura de Datos Relacional

Base de datos que se puede percibir como un conjunto de tablas y se puede


manipular según el modelo relacional de los datos. Cada base de datos incluye:

 Conjunto de tablas de catálogo de sistema que describe la estructura lógica y


física de los datos.
 Archivo de configuración que contiene los valores de parámetro asignados a la
base de datos.
 Registro de recuperación con transacciones en curso y transacciones archivables.

Jerarquía de la Base de Datos

Componente Descripción
Diccionario de Repositorio de información sobre los programas de
datos aplicaciones, las bases de datos, los modelos de datos lógicos
y las autorizaciones para una organización.
Cuando cambia el diccionario de datos, el proceso de cambio
incluye comprobaciones de edición que pueden impedir daños
en el diccionario de datos. El único modo de recuperar un
diccionario de datos es restaurarlo desde una copia de
seguridad.
Contenedor Ubicación de almacenamiento de datos, por ejemplo, un
directorio de archivos, o dispositivo, que se utiliza para definir
una base de datos.
Partición de Unidad lógica de almacenamiento en una base de datos, por
almacenamiento ejemplo, una colección de contenedores. Las particiones de
almacenamiento de base de datos se denominan espacios de
tabla en DB2.
Objeto de Entidad tangible dentro de una aplicación que los usuarios
negocios crean, manipulan y a la que acceden mientras realizan un caso
de uso. Normalmente, los objetos de negocio en un sistema
tienen un estado, son persistentes y duraderos. Los objetos de
negocio contienen datos de negocio y conforman el
comportamiento del negocio.
Objeto de base de Objeto que existe en una instalación de un sistema de base de

28
Componente Descripción
datos datos, por ejemplo, una instancia, una base de datos, un grupo
de particiones de base de datos, una agrupación de
almacenamiento intermedio, una tabla o un índice. Un objeto
de base de datos contiene datos y no tiene comportamiento.
Tabla Objeto de base de datos que contiene una colección de datos
para un tema específico. Las tablas constan de filas y
columnas.
Columna Componente vertical de una tabla de base de datos. Una
columna tiene un nombre y un tipo de datos específico, por
ejemplo, carácter, decimal o entero.
Fila Componente horizontal de una tabla, que consta de una
secuencia de valores, uno para cada columna de la tabla.
Vista Tabla lógica que se basa en datos almacenados en un conjunto
subyacente de tablas. Los datos devueltos por una vista los
determina una sentencia SELECT que se ejecuta en las tablas
subyacentes.
Índice Conjunto de punteros que están ordenador lógicamente según
los valores de una clave. Los índices proporcionan acceso
rápido a los datos y pueden imponer la exclusividad de los
valores de clave para las filas en la tabla.
Relación Vínculo entre uno o más objetos que se crea especificando una
sentencia join.
Join Operación relacional SQL en la que los datos pueden
recuperarse de dos tablas, normalmente basada en una
condición de unión que especifica columnas de unión.

Tablas del Diccionario de Datos

La estructura de una base de datos relacional se almacena en las tablas del


diccionario de datos de la base de datos.

Integrity Checker

Integrity Checker es un programa de utilidad de configuración de base de datos


que puede utilizar para evaluar el estado de salud del diccionario de datos de la
capa base. La herramienta compara el diccionario de datos con el esquema de la
base de datos física subyacente. Si se detectan errores, la herramienta genera
mensajes de error que detallan cómo se resuelven los problemas.

29
Particiones de Almacenamiento

Una partición de almacenamiento de base de datos es la ubicación en la que se


almacena un objeto de base de datos en un disco. Las particiones de
almacenamiento de base de datos se denominan espacios de tabla en DB2

Objetos de Negocio

Un objeto de negocio es un objeto que tiene un conjunto de atributos y valores,


operaciones y relaciones con otros objetos de negocio. Los objetos de negocio
contienen datos de negocio y conforman el comportamiento del negocio.

Objetos definidos por el usuario

Los objetos pueden crearse de dos formas: puede crear un objeto en la base de
datos o un objeto puede estar definido de forma nativa en la base de datos. Los
objetos definidos por el usuario siempre se crean en la aplicación Configuración
de base de datos.
Niveles de configuración para objetos

Los niveles describen el ámbito de los objetos y debe aplicarse a los objetos.
Según el nivel que asigne a los objetos, deberá crear ciertos atributos. Para que los
usuarios accedan a un objeto, debe existir un valor de atributo al nivel al cual
tienen autoridad. El nivel que asigna a un objeto a veces depende del nivel del
registro en la base de datos.

Relaciones de bases de datos

Las relaciones de bases de datos son asociaciones entre tablas que se crean
utilizando sentencias de unión para recuperar datos.

Atributos de objeto de negocio

Los atributos de objetos de negocio contienen los datos asociados a un objeto de


negocio. Un atributo persistente representa una columna de tabla de base de datos
o una columna de vista de base de datos. Un atributo no persistente sólo existe en
la memoria, porque los datos asociados con el atributo no se almacenan en la base
de datos.

Tipos de datos de atributos

Cada registro de base de datos contiene varios atributos. Cada atributo tiene un
tipo de datos asociado.

Vistas de base de datos

30
Una vista de base de datos es un subconjunto de una base de datos y se basa en
una consulta que se ejecuta en una o más tablas de base de datos. Las vistas de
base de datos se guardan en la base de datos como consultas con nombre y se
pueden utilizar para guardar consultas completas que se utilizan con frecuencia.

Índices

Puede utilizar índices para optimizar el rendimiento de la captura de datos. Los


índices proporcionan punteros a las ubicaciones de los datos a los que se accede
con frecuencia. Puede crear un índice en las columnas de un objeto que consulta
con frecuencia.

Claves Primarias

Cuando asigna una clave primaria a un atributo, la clave identifica de forma


exclusiva el objeto asociado a dicho atributo. El valor de la columna primaria
determina qué atributos se utilizan para crear la clave primaria.

2.10.5 Seguridad e Integridad de los Datos

El SGBD debe vigilar las peticiones del usuario y rechazar todo intento de violar
las restricciones de seguridad y de integridad definidas por el DBA
(Administrador). Estas tareas pueden realizarse durante el tiempo de compilación,
de ejecución o entre ambos.
El sistema de seguridad debe garantizar:
 La protección de los datos contra accesos no autorizados, tanto intencionados
como accidentales. Debe controlar que solo los usuarios autorizados accedan a la
BD.
 Ser capaz de recuperar la BD llevándola a un estado consistente en caso de ocurrir
algún suceso que la dañe.
 Ofrecer mecanismos para conservar la consistencia de los datos en el caso de que
varios usuarios actualicen la BD de forma concurrente.

2.10.6 Arquitectura

Hay tres características importantes inherentes a los sistemas de bases de datos: la


separación entre los programas de aplicación y los datos, el manejo de múltiples
vistas por parte de los usuarios y el uso de un catálogo para almacenar el esquema
de la base de datos. En 1975, el comité ANSI-SPARC (American National
Standard Institute - Standards Planning and Requirements Committee) propuso
una arquitectura de tres niveles para los sistemas de bases de datos, que resulta
muy útil a la hora de conseguir estas tres características. El objetivo de la

31
arquitectura de tres niveles es el de separar los programas de aplicación de la base
de datos física. En esta arquitectura, el esquema de una base de datos se define en
tres niveles de abstracción distintos: En el nivel interno se describe la estructura
física de la base de datos mediante un esquema interno. Este esquema se
especifica mediante un modelo físico y describe todos los detalles para el
almacenamiento de la base de datos, así como los métodos de acceso.

En el nivel conceptual se describe la estructura de toda la base de datos para una


comunidad de usuarios (todos los de una empresa u organización), mediante un
esquema conceptual. Este esquema oculta los detalles de las estructuras de
almacenamiento y se concentra en describir entidades, atributos, relaciones,
operaciones de los usuarios y restricciones. En este nivel se puede utilizar un
modelo conceptual o un modelo lógico para especificar el esquema. En el nivel
externo se describen varios esquemas externos o vistas de usuario. Cada esquema
externo describe la parte de la base de datos que interesa a un grupo de usuarios
determinados y ocultos a ese grupo el resto de la base de datos. En este nivel se
puede utilizar un modelo conceptual o un modelo lógico para especificar los
esquemas. La mayoría de los SGBD no distinguen del todo los tres niveles.
Algunos incluyen detalles del nivel físico en el esquema conceptual. En casi todos
los SGBD que se manejan vistas de usuario, los esquemas externos se especifican
con el mismo modelo de datos que describe la información a nivel conceptual,
aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles
conceptuales y externo. Hay que destacar que los tres esquemas no son más que
descripciones de los mismos datos pero con distintos niveles de abstracción. Los
únicos datos que existen realmente están a nivel físico, almacenados en un
dispositivo como puede ser un disco. En un SGBD basado en la arquitectura de
tres niveles, cada grupo de usuarios hace referencia exclusivamente a su propio
esquema externo. Por lo tanto, el SGBD debe transformar cualquier petición
expresada en términos de un esquema externo a una petición expresada en
términos del esquema conceptual, y luego, a una petición en el esquema interno,
que se procesará sobre la base de datos almacenada. Si la petición es de una
obtención (consulta) de datos, será preciso modificar el formato de la información
extraída de la base de datos almacenada, para que coincida con la vista externa del
usuario. El proceso de transformar peticiones y resultados de un nivel a otro se
denomina correspondencia o transformación. Estas correspondencias pueden
requerir bastante tiempo, por lo que algunos SGBD no cuentan con vistas
externas. La arquitectura de tres niveles es útil para explicar el concepto de
independencia de datos que podemos definir como la capacidad para modificar el
esquema en un nivel del sistema sin tener que modificar el esquema del nivel
inmediato superior. Se pueden definir dos tipos de independencia de datos: La
independencia lógica es la capacidad de modificar el esquema conceptual sin tener
que alterar los esquemas externos ni los programas de aplicación. Se puede

32
modificar el esquema conceptual para ampliar la base de datos o para reducirla.
Si, por ejemplo, se reduce la base de datos eliminando una entidad, los esquemas
externos que no se reeran a ella no deberán verse afectados. La independencia
física es la capacidad de modificar el esquema interno sin tener que alterar el
esquema conceptual (o los externos). Por ejemplo, puede ser necesario reorganizar
ciertos cheros físicos con el fin de mejorar el rendimiento de las operaciones de
consulta o de actualización de datos. Dado que la independencia física se reere
sólo a la separación entre las aplicaciones y las estructuras físicas de
almacenamiento, es más fácil de conseguir que la independencia lógica. En los
SGBD que tienen la arquitectura de varios niveles es necesario ampliar el catálogo
o diccionario, de modo que incluya información sobre cómo establecer la
correspondencia entre las peticiones de los usuarios y los datos, entre los diversos
niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar
estas correspondencias haciendo referencia a la información de correspondencia
que se encuentra en el catálogo. La independencia de datos se consigue porque al
modificarse el esquema en algún nivel, el esquema del nivel inmediato superior
permanece sin cambios, sólo se modifica la correspondencia entre los dos niveles.
No es preciso modificar los programas de aplicación que hacen referencia al
esquema del nivel superior. Por lo tanto, la arquitectura de tres niveles puede
facilitar la obtención de la verdadera independencia de datos, tanto física como
lógica. Sin embargo, los dos niveles de correspondencia implican un gasto extra
durante la ejecución de una consulta o de un programa, lo cual reduce la eficiencia
del SGBD. Es por esto que muy pocos SGBD han implementado esta arquitectura
completa.

33
CONCLUSIONES

Durante la realización de este trabajo de investigación, amplié el conocimiento


acerca del, lenguaje SQL, de los sistemas de gestión de bases de datos, y su
importancia y utilidad a la hora de almacenar, clasificar y manejar información, de
cualquier tipo.

Desde usuarios particulares, hasta grandes empresas, gozan de las ventajas que
brindan los SGBD, desde clasificar la información según el criterio deseado por el
usuario, modificar la información que contiene una base de datos, entre otras

MySQL ha sido un gestor de bases de datos muy útil desde que fue creado, y con
el tiempo, nuevas funciones se le añadieron, expandiéndolo y volviéndolo más
útil, y convirtiéndose así en uno de los gestores de bases de datos más utilizados a
nivel mundial, junto a Oracle. Por otro lado, PostgreSQL es un SGBD
continuamente modificado y actualizado por un grupo de desarrolladores a nivel
mundial (PostgreSQL Global Development Group), también basado en el lenguaje
SQL.

SQL significó un gran avance para este fin, almacenar y clasificar información,
además de que gracias a su aparición, hoy en día existe una gran variedad de
SGBD basados en el lenguaje SQL, como MySQL, PostgreSQL, Oracle, entre
otros. Desde su estandarización, casi todos los programas que trabajan con bases
de datos, utilizan este lenguaje, con diferentes variaciones y funciones, según el
tipo de software y su objetivo.

Un modelo de datos es un conjunto de conceptos que se utilizan para describir el


esquema de una base de datos, las operaciones para manejar los datos y el
conjunto de reglas de integridad. Hay tres categorías principales de modelos de
datos: modelos conceptuales, modelos lógicos y modelos físicos. Es importante
distinguir entre el esquema (descripción de una base de datos) y la base de datos
en sí misma. El esquema no cambia a menudo, en tanto que la base de datos
cambia cada vez que se insertan, eliminan o modifican datos. La arquitectura de
los sistemas de bases de datos establecida por ANSI-SPARC utiliza tres niveles de
abstracción: externo, conceptual e interno. En el nivel externo, el esquema consta
de las distintas visiones que tienen los usuarios de la base de datos. En el nivel
conceptual, el esquema es la visión común de la base de datos. Especifica el
contenido de información de la base de datos independientemente de las
consideraciones de almacenamiento. En el nivel interno, el esquema es la visión
que el ordenador tiene de la base de datos. Específica cómo se representan los
datos, en qué orden se almacenan los registros, qué índices y punteros se han
creado y qué esquema de dispersión se ha utilizado, si es el caso. Todo SGBD que
separe los tres niveles deberá tener correspondencias entre los esquemas para

34
transformar las peticiones de los usuarios y los resultados, de un nivel al siguiente.
La mayoría de los SGBD no separan los tres niveles por completo. La
independencia de datos hace que cada nivel de la arquitectura sea inmune a los
cambios en los niveles de debajo. La independencia de datos lógica se reere a la
inmunidad de los esquemas externos frente a los cambios en el esquema
conceptual. La independencia de datos física se reere a la inmunidad del esquema
conceptual frente a los cambios en el esquema interno. Un lenguaje de base de
datos consta de dos partes: un lenguaje de definición de datos (LDD) y un
lenguaje de manejo de datos (LMD). El LDD se utiliza para especificar el
esquema de la base de datos, las vistas de los usuarios y las estructuras de
almacenamiento, mientras que el LMD se utiliza para leer y actualizar los datos de
la base de datos. Los SGBD se pueden clasificar de acuerdo con el modelo lógico
que soportan, el número de usuarios, el número de puestos, el coste y la
generalidad. La clasificación más importante de los SGBD se basa en el modelo
lógico, siendo los principales modelos que se utilizan en el mercado el relacional,
el de red, el jerárquico y el orientado a objetos.

35
BIBLIOGRAFÍA

36

También podría gustarte