Está en la página 1de 8

Estructura y organización

de una base de datos

Guglielmo Trentin

Cualquier profesor inquieto que acumule datos para su trabajo


sabe lo complicado de organizarlos y explotarlos bien. De hecho
manejar bien la información es tan importante o más para la
enseñanza y el aprendizaje como la propia información. Una de
las herramientas del ordenador de uso generalizado, las bases de
datos, constituye por tanto un recurso básico para el profesa; el
alumno y el propio proceso educativo. Aquí se hace una
presentación de posibilidades y problemas para emplearlo con
eficacia.

INTRODUCCION QUE ES UNA BASE DE DATOS

Organizar la información en función de una Antes de entrar en consideraciones vamos a ob-


rápida recuperación es indudablemente un factor servar el análisis, el proyecto y la realización de
determinante en muchos sectores de la actividad, una base de datos. Empezaremos por una defi-
sin olvidar las necesidades tanto en el ámbito de nición.
la decisión, como el consultar y analizar siempre Una base de datos es un conjunto de datos es-
mucha más cantidad de información; basta por tructurados y permanentes agrupados por su ho-
ejemplo, con pensar en el problema cotidiano del mogeneidad y relacionados entre ellos, organizados
que administra un almacén o una biblioteca. De con la mínima redundancia para ser usados en apli-
ahí la utilidad de organizar la información en es- caciones diversas, de modo controlado.
tructuras fácilmente administrables y que asegu- En la práctica una base de datos es un con-
ren una elevada velocidad de acceso. junto de archivos, convenientemente ordenados,
Existen factores muy interesantes en la fase de que debe responder a las siguientes características:
proyectar y realizar una base de datos, factores de estar completamente integrado (no sólo jun-
notable interés conceptual sobre todo si se ve la tar los datos sino ponerlos en relación en-
planificación de la base de datos como el momen- tre ellos);
to de ordenación y construcción de la realdidad asegurar la velocidad de acceso a la infor-
en términos de entidad y de su interrelación. mación;
En este trabajo veremos la evidencia de estos asegurar una completa gestión de los datos;
aspectos conceptuales sin entrar en los detalles fun- permitir un acceso competente a la infor-
cionales, y menos aún de los de implementación, mación;
de los sistemas específicos para la gestión de la base asegurar la privacidad de la información;
de datos. asegurar la reconversión de los datos en ca-
so de mal funcionamiento;

Comunicación, Lenguaje y Educación, 1992, 13, 81-88


82
Seguidamente vamos a tomar en consideración LA PROYECCION CONCEPTUAL
sólo alguna de estas características, no queremos
profundizar en los argumentos relativos al acceso En la fase de proyección conceptual de una ba-
competente, a la privacidad de la información y se de datos, el objetivo principal concierne al aná-
a la reconversión. lisis de aquella porción de la realidad y de los
acontecimientos que se verifican a ella, que sean
LA IMPORTANCIA DE SABER MODELAR de interés para el entorno de aplicación en el cual
LA REALIDAD la base de datos debe poder ser utilizada.
El análisis de la realidad puede ser visto en dos
A menudo, cuando buscamos adquirir cono- direcciones: la primera, que llamaremos horizon-
cimientos más profundos de una realidad parcial- tal, atañe a la realidad considerada en su exten-
mente conocida, se hace un modelo fijando la sión, por consiguiente a todos los aspectos que la
atención al aspecto que más interesa profundizar. componen. La segunda, que llamaremos vertical,
Del estudio del modelo a menudo es posible ob- concierne en cambio a nuestra relación con la rea-
tener la información que nos permita tomar deci- lidad considerada: lo que efectivamente de ella nos
siones en función de una finalidad previamente
fijada. Para comprender mejor este aspecto clave, FIGURA 1
escogeremos un ejemplo sencillo tomando como
referencia el esquema expuesto en la fig. 1. Del análisis de la realidad a su interpretación
Supongamos que se debe averiguar la aerodi-
námica del prototipo de un coche; en este caso la realidad
realidad es el coche en sí mismo. Pero lo que inte-
resa, al terminar el estudio de la aerodinámica, es
el perfil del coche, eventualmente el material con
que se construirá la carrocería, descuidando todos
los aspectos que no estén asociados al objetivo que ABSTRACCION

nos proponemos como peso total, el tipo de mo-


tor, el interior, etc.
Determinando los intereses particulares hemos
hecho una abstracción, es decir hemos separado
ciertos aspectos de la realidad cognoscitiva de los
otros, que sin embargo conocemos. En efecto, en
distintas circunstancias, cada uno de nosotros, fren-
te a una cierta realidad, ejercemos una elección dis-
tinguiendo las características que nos interesan de
las que no nos interesan y por consiguiente las ig-
noramos.
Una vez determinados los aspectos significa-
tivos de la realidad que se quiere moldear, nace
la necesidad de representarla. Prosiguiendo con el
ejemplo del coche, la representación consistirá en
la realización de una maqueta en la que destaca-
remos únicamente las características relativas al
perfil y posiblemente el material utilizado para
ELABORACIÓN
construir el chasis.
Respecto a la representación en este momento
ya podemos trabajar, o sea podemos ejecutar las
oportunas elaboraciones en la maqueta para tratar
de obtener la información que necesitamos (la ma-
queta del coche va a pasar por el tunel de viento
y será expuesto a una serie de pruebas y medidas).
El resultado de la elaboración (turbulencias,
inestabilidad,...) debe ser llevado al contexto real
del cual se ha extraído el modelo (el coche que se INTERPRETACIÓN
debe construir); este proceso es en algún sentido
la operación inversa de la abstracción, que llama-
remos interpretación. En efecto, la interpretación
de los resultados de la elaboración da la pauta pa- Valoraciáric)
ra decidir cómo actuar en la realidad y por consi- la realidad
guiente, en definitiva, dar sentido al mismo
modelo.
83
interesa. La actividad de análisis viene normalmen- FIGURA 2
te transferida a través de los procesos de unifica- Simbología usada en el modelo entidad/relación
ción, de clasificación y de generalización.
La unificación consiste en reducir varios obje-
Entidad
tos en una sola unidad: una cabeza, dos brazos,
dos piernas y un tronco forman la entidad hombre.
El segundo proceso, la clasificación, permite
dividir los individuos en clases y por consiguien- Relación binaria entre entidad
te dar una cierta estructura a la realidad. La clasi-
ficación además se puede hacer por extensión y
por designación: en el primer caso se da explíci-
tamente la lista de los individuos que pertenecen Relación ternaria entre entidad
a la clase (perro, gato, topo...), en el segundo se
determina la clase a través de la cual se especifica
una propiedad que caracteriza a sus elementos (cua-
drúpedos). Se observa que en la base de datos la
clase (o identidad) siempre se da por extensión, Atributo de entidad o relación
en cuanto un archivo contiene exactamente los da-
tos de varios individuos que componen la misma
clase; al revés, la búsqueda de la información está
hecha habitualmente por designación, o sea espe- Atributo que constituye una clave
cificando una propiedad que caracteriza a los in- primaria de la entidad.
dividuos que buscamos.
Finalmente, en lo que concierne al proceso
de generalización, consideramos el siguiente ejem-
plo: una escuela X se la puede ver como un con- FIGURA 3
junto de clases y cada clase compuesta por dis- Los atributos de la entidad
tintos alumnos. Generalizando se puede decir
que cada alumno, pertenece a una cierta clase y
también es alumno de la escuela X. En el ejemplo
resulta evidente que la propiedad más importante
de la generalización es la capacidad de transmi-
sión de las características.
Por lo tanto en cada análisis, la realidad se pre-
senta como una colección de entidades conecta-
das entre ellas por una red de asociación.
Utilizando una simbología muy sencilla (fig. 2) es
posible obtener una formalización de la realidad
llegando al denominado esquema conceptual; en
particular, en este trabajo utilizaremos el modelo
entidad-relación. En el esquema conceptual, ya sea
por la entidad como por la asociación, vienen es-
pecificados los atributos, es decir, la propiedad y
las características que nos interesan para el análi-
sis de la porción de realidad a la cual se refiere
(fig. 3). El atributo o los atributos que determi-
nan univocamente a una entidad se llaman «cla-
ves primarias»
(fig. 4,a): en efecto muchos estudiantes están aso-
LA ASOCIACION ciados a la misma clase, mientras un estudiante
puede formar parte de una sola clase. Se observa
Un aspecto relevante del esquema conceptual que la asociación uno-a-uno (1:1) es una particula-
atañe a la tipología de la asociación entre entida- ridad de la una-a-muchos; un ejemplo es la aso-
des. Las asociaciones son la red de conexión de ciación entre la entidad persona y la entidad código
una base de datos y sólo tomaremos en considera- fiscal (fig. 4.6): cada persona se la puede asociar
ción, aquellas que nos pueden aportar una contri- a un solo código fiscal y cada código fiscal se re-
bución efectiva en la estructuración. En general fiere a una sola persona. Al revés, un ejemplo de
las asociaciones pueden ser de dos tipos: uno-a- asociación muchos-a-muchos es aquel que asocia
muchos (1:n) y muchos-a-muchos (n:m). Un ejem- la entidad maestro de una escuela a la entidad clase
plo de asociación uno-a-muchos es aquel que aso- (fig.4,c): un maestro puede enseriar a varias clases
cia una clase de alumnos con los mismos alumnos y cada clase puede tener muchos maestros.
84
FIGURA 4 informático debemos tener en cuenta la estructu-
Tipo de asociación ra de la elaboración, su capacidad y la tecnología
informática de que disponemos hoy. También la
Clase iiompone
Alumnno base de datos, en cuanto modelo informático, no
escapa de este tipo de dependencia y su represen-
a) Asociación múltiple (1,n) tación está íntimamente conectada a problemas de
tipo tecnológico.
En síntesis se puede decir que la representa-
Código ción de una base de datos está en función de la
Persona lene
Fiscal tecnología, es decir el modelo adoptado para es-
10 Asociación 1,1
tructurar y administrar la información contenida
en la misma base de datos, en una palabra, de la
Base de Datos Management System (BDMS). En
efecto, se dice que el esquema lógico de una base
Clase
Profesor de datos, concepto que revisaremos en seguida, tie-
ne en cuenta el modelo de BDMS adoptado.
c) asociación múltiple (flirt)
Para comprender mejor las diferentes tipolo-
gías del BDMS, creemos oportuno abrir un parén-
- cada individuo entra una y sólo una vez en la asociación tesis referente al modo de cómo los datos pueden
- cada individuo puede entrar ninguna vez o sólo una vez estar interrelacionados entre sí en una estructura.
- cada individuo puede entrar una o más veces en la asociación
Efectivamente, es la naturaleza de esta relación la
que determina una estructura física distinta de la
—1--n•• cada individuo puede entrar 0,1 o más veces en la asociación
base de datos.

Tanto para el valor, como para la asociación es


EL CONECTOR
posible definir atributos. Existen, en efecto, situa-
ciones en las cuales ciertos atributos no son pro- Para relacionar la entidad de una misma base
piedad separada de una de las dos entidades en de datos, normalmente se acostumbra usar dos ti-
relación, pero son características de la asociación pos de referencia: el conector gráfico y el conec-
en cuanto a tal. Por ejemplo, si nos referimos a tor lógico.
la situación de la fig. 5, en la cual viene ilutrada Vamos a analizar estas dos técnicas distintas
la asociación entre partidos del campeonato de fút- con la ayuda de un simple ejercicio. Supongamos
bol y jugadores de los diferentes clubs, es eviden- que una firma X decide organizar una base de da-
te que los atributos «goles hechos» y «número de tos propia articulándola en dos archivos (entidad):
la camiseta» no son propios de la entidad, dato que el archivo EMPRESA en donde se registra la in-
puede variar según el encuentro que se disputa. formación relativa a la empresa a quien la firma
X vende ciertos productos y el archivo FACTU-
RA, en donde se registra las facturas emitidas por
FIGURA 5 la firma X. A esta situación corresponde el esque-
Los atributos de la asociación ma conceptual de la fig. 6.

FIGURA 6
Relación entre factura y empresa a la cual se le ha
emitido

Hemos visto hasta ahora cómo el proceso de Vamos a ver ahora dos maneras distintas de re
formalización conduce al esquema conceptual. Ya lacionar entre sí esta información.
sea el esquema conceptual o en índice de funcio- Uso del conecto,. gráfico. La situación prevé que
nalidad que está realizado sobre él, son el produc- cada elemento (récord) del archivo EMPRESA,
tos de la actividad de abstracción, y por esto la además de contener información de una empresa
base de partida de la actividad de representación determinada Y (atributo), contenga también infor-
(fig. 1). mación acerca de la posición física de la primera
Como en un modelo físico (véase el ejemplo factura, emitida de X a Y, registrada en el archivo
del coche) la representación de la realidad está aso- FACTURA. A su vez los elementos del archivo
ciada a los materiales disponibles y al modo de co- FACTURA poseen, más información de la que
mo éstos se pueden plasmar, así en un modelo contiene una factura normal, la referencia a la po-
85
sición física de las sucesivas facturas emitidas de un archivo, son actividades totalmente transparen-
X en comparación con Y (fig. 7). tes al usuario y se grava únicamente en la imple-
En esta manera de referenciar los elementos mentación del modelo de BDMS que se escogerá.
de la base de datos, el archivo EMPRESA se de- Uso del conector lógico. En este caso no tene-
nomina owner, mientras el archivo FACTURA mos creados vínculos físicos entre los elementos
member: esto da lugar a que se defina una infor- de la entidad pero se juega con sus atributos co-
mación primaria (aquella contenida en EMPRE- munes. En el ejemplo se ha utilizado el atributo
SA) relacionada de algún modo a información Código Fiscal de la empresa repetido en la infor-
secundaria (la que está contenida en FACTURA). mación que caracteriza la entidad factura (fig. 8).
La decisión de definir un valor ownner o member En el momento de interrogar será la BDMS la que
depende del tipo de operaciones ejecutadas más pondrá en relación las dos entidades a través de
frecuentemente en la base de datos. la clave de lectura Código Fiscal.

FIGURA 7 FIGURA 8

Conector gráfico Conector gráfico

EMPRESA

Nombre Dirección Municipio Cód. Fiscal

FACTURA

N.° Producto Cód. Fiscal

Modelo de base de datos


Al llegar a este punto ya se habrá intuido que
En general, para acelerar el acceso a la infor- uno de los elementos que caracteriza el modelo de
mación, el owner está indicado: en nuestro ejem- una base de datos es la técnica usada para realizar
plo la indicación podría hacerse en el atributo el conector. Normalmente los modelos están cla-
Nombre Empresa. En el ejemplo se parte de la hi- sificados en sentido jerárquico, reticular y relacio-
pótesis de que la pregunta típica sea: dada una em- nal. Seguidamente vamos a examinar sólo los dos
presa Y extraer todas las facturas que se le han últimos modelos dado que el jerárquico no es más
estado emitiendo. Obviamente si las operaciones que una particularización del modelo reticular.
más frecuentes fueran la extracción de la empresa
a quien corresponde una cierta factura, podríamos Modelo reticular
haber definido como owner la entidad FACTU-
RA y member la entidad EMPRESA. El modelo reticular adopta la técnica del co-
Ultima consideración: el ejemplo se refiere a nector gráfico para relacionar los elementos de la
la versión más sencilla de enlace mediante el co- base de datos. En él la información está estructu-
nector gráfico. Son, en efecto, soluciones en las rada según una red de archivos conectados entre
cuales el vínculo entre los elementos de la infor- sí en relación 1:n. En efecto la estructura es muy
mación secundaria es de tipo bidireccional. De to- parecida al esquema conceptual: la entidad y la aso-
dos modos, ya sea la gestión de los vínculos ciación representada en el esquema conceptual, que
unidireccional o bídireccional, y la gestión del co- se convierte en el récord type y el ret respecti-
nector a la posición gráfica de los elementos de vamente.

86
En general el modelo se basa en una estructu- FIGURA 10
ra de dos archivos de los cuales uno, llamado mas-
ter, sirve para el acceso a la información primaria, La dependencia funcional
y el otro, llamado variable, para el acceso a la in-
formación secundaria. Utilizando siempre el ejem-
plo de la empresa y de la factura, la fig. 9 muestra
la interrelación entre los elementos de las diferen-
tes entidades.

FIGURA 9

El modelo reticular

Ahora, si en lugar de utilizar una fórmula ma-


temática utilizamos una lista de dos columnas (fig.
11.a) una relativa a la empresa y la otra se refiere
a la ciudad, habremos caracterizado igualmente
una relación entre la clase Empresa y la clase Ciu-
dad. Luego la relación se podría extender a la in-
formación sobre la dirección, el código fiscal, etc.
(fig. 11,b).

FIGURA 11

Tablas y relación

Nombre Empresa Ciuded Nombre Empresa Ciudad Dirección Cod.Fiscal

FIAT Tono FIAT tt>

El hecho de utilizar enlaces bidireccionales ya


sea a nivel de elementos de una misma entidad
(Factura-Y-1, Factura-Y-2) que a nivel de elemen-
tos de entidad diferente (Empresa-Y, Factura-Y-1)
garantiza un acceso rápido a los datos a pesar de
que partiendo de una información secundaria
(Factura-i-j), se quiere remontar a la correspondien-
te información primaria (Empresa-i a quien se le
ha facturado).
Decimos que el conjunto de «tuple» (llamamos
así al renglón del cuadro en la terminología del mo-
Modelo relacional delo relacional) que caracteriza una relación, cons-
tituyen también un archivo, en el cual el récord
El modelo relacional adopta la técnica del pun- es la tuple en singular. En este punto es necesario
teador lógico y tiene un enfoque rigurosamente hacer algunas precisiones sobre la terminología usa-
matemático. Para comprender mejor el concepto da en el modelo relacional, o mejor, ver qué co-
de relación vamos a hacer un ejercicio muy sim- rrespondencia hay entre los conceptos de tipo
ple. Si observáis la fig. 10, en donde A identifica general vistos hasta ahora (y válidos también para
la clase de Empresa italiana y C la clase de la Ciu- el modelo reticular) y los análogos del mundo re-
dad italiana. lacional. Con este objeto hemos confeccionado el
Para indicar que la empresa FIAT tiene su se- cuadro de la fig. 12.
de en Turín, se puede escribir usando una anota- Lo más patente es que mientras en el modelo
ción muy parecida a la matemática reticular una tabla, por analogía está asociada al
tiene-sede-en(FIAT, TURIN) concepto récord, en el modelo relacional el cua-
Si consideramos la clase entera de la empresa dro define las verdaderas y propias relaciones en-
A = (al, a2, ...an) tre clases.
Y si a cada una de ellas asociamos la ciudad rela- Finalmente, si se vuelve a tomar en conside-
tiva, obtenemos una clase de pareja. ración la fig. 8, es fácil comprender cómo en el
C = 8(al, cl),(a2, c2),...,(an, cn.)9 modelo relacional es posible utilizar la técnica del
que concreta la relación «tiene-sede-en». conector lógico para asociar las tablas entre ellas.
87
FIGURA 12 dad que se va investigando. Por ejemplo: «¿a cuán-
Nota sobre la terminología usada to asciende la facturación de una cierta empresa?,
«¿qué empresa está al día con los pagos?», «equé
empresa ha superado una fecha de facturación?»,
Madelo relacional Terminología general
etc.
re&sción archivolentidad En la práctica, en la fase de interpretación, de-
zupia récord bemos poder evaluar, con un margen de sencillez,
todos los aspectos que han orientado los modelos
posición en la tupb, campo
de la porción de realidad que nos interesa.
(nombre de la) eknet atributo Puede ser que la fase de interpretación no sa-
dominio conjunto de los valores de un atributo...
tisfaga plenamente al usuario; esto llega por ejem-
plo, cuando se encuentran dificultades en la
extracción o en la valoración de los resultados. En
la mayoría de los casos, tales problemas son im-
putables a una estructuración de la base de datos
poco adecuada a las exigencias reales del usuario.
DE LA REPRESENTACION En estas circunstancias, las dificultades que sur-
A LA INTERPRETACION gen deben servir como sugerencias para las suce-
La adopción de un modelo particular de sivas modificaciones que se deben aportar a la base
BDMS caracteriza el denominado esquema lógi- de datos.
co de la base de datos. Anteriormente, hemos vis-
to cómo partiendo de un mismo esquema CONCLUSIONES
conceptual (formalización de la base de datos), es
posible otener distintos esquemas lógicos en don- Ultimamente, gracias a la evolución de la tec-
de cada uno tiene en cuenta el modelo particular nología y la consiguiente reducción de los costes,
adoptado. hemos asistido a la creciente difusión de los ela-
Un aspecto muy importante concierne al mo- boradores y de su uso para facilitar y potenciar la
do con el cual «interpretamos» los distinos mode- posibilidad de tratamiento de la información. Pa-
los de la base de datos del sistema para la gestión ralelamente las nuevas tecnologías informáticas
de los datos, es decir, por ejemplo, cómo un siste- proponen nuevos modelos de sistema para la ges-
ma comercializado O-DS/II, ORACLE, etc.) im- tión de los datos.
plementa la filosofía reticular o la relacional. La De todos modos no se debe olvidar que este
adaptación del esquema de la base de datos a éste instrumento nos reporta un beneficio en relación
o a otro sistema existente en el mercado (o reali- de cómo lo utilicemos. Un sistema informático en
zado expresamente) nos lleva a la definición del general sustituye, mejorándolo, a un sistema infor-
esquema físico. El esquema físico es pues en defi- mático preexistente; si nos falta esto o está mal or-
nitiva la representación informática de la base de ganizado, el esfuerzo que empleamos para construir
datos. el sistema informático es desproporcionado con
Una vez la estructura representada y memori- respecto a los beneficios que podemos obtener. Es
zada por el elaborador, utilizando el llamado pura utopía creer que se puede sustituir el elabo-
(DDL) Definición del Lenguaje de los Datos, se rador cuando falta orden y organización.
pasa a la introducción de los datos y por consi- Resulta esencial, en primer lugar, saber con-
guiente a su elaboración. Esta última consiste prin- ceptualizar la organización de los datos y de la in-
cipalmente en la interrogación de la base de datos formación utilizada para modelar el trozo de
haciendo uso del «query» lenguaje, específico de realidad que queremos tratar. Por este motivo han
cada BDMS. El resultado que de aquí se deriva sido creadas y dotadas distintas metodologías, al-
son los elementos esenciales para poder efectuar gunas de las cuales, al menos en principio, calca
cualquier tipo de interpretación acerca de la reali- la esquematización utilizada en este trabajo.
88
Referencias
ALBANO A., ORSINI R. (1985) Basi di Dati, Serie de informática, Boringhieri, Torino.
SPRUGNOLI R. (1987) Le Basi di Dati, Editori Riuniti, Roma.
CERI S., MISSIKOFF M., Y SCHMIDT J. W. (1988) Advances in Data base Technology. EDBT'88, International Confe-
rence on Extending Data base Technology. Venecia '88, Ediciones G. Goos y J. Hartmanis.

Estructura y organización de una


base de datos
Guglielmo Trentin
CL&E, 1992, 13, pp. 81-88

Datos del autor: Trabaja en el Instituto para la Tecnología.

Dirección: Instituto per le Tecnologie Drolettiche CNR. Genova- via all'Opera Pora, n.° 11, 16 145 Genova.

Artículo original: Struttura e organizzazione di un data base. Golem n.° 2, 1990, 8-14. Reproducido con
autorización. Traducción de Lola Abelló.

C) De todos los artículos deberá solicitarse por escrito autorización de CL&E y de los autores para el
uso en forma de facsímil, fotocopia o cualquier otro medio de reproducción impresa. CL&E se reserva
el derecho de interponer las acciones legales necesarias en aquellos casos en que se contravenga la ley de
derechos de autor.

También podría gustarte