Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Formas Normales para Base de Datos
Formas Normales para Base de Datos
Bases de Datos
Formas Normales
Para construir un sistema de informacin que responda a un problema real concreto, lo primero que
hay que hacer es decidir cul es el esquema relacional ms adecuado. Encontrar la mejor manera de
agrupar los datos en forma de tablas y de relacionar stas entre s, es la esencia del diseo de bases de
datos relacionales. Por ello, muchos autores se han dedicado a delimitar los problemas que se pueden
presentar por una composicin inadecuada de las tablas y a especificar las condiciones que stas
deben cumplir para evitarlos. Estas propiedades exigibles a cada tabla se conocen con el nombre de
Formas Normales.
A partir de ellas, para decidir la composicin de las tablas de una base de datos, hay dos formas de
proceder:
Descomposicin: suponer que todos los atributos estn agrupados formando una sola
tabla, que se va dividiendo paulatinamente.
En cada etapa debe verificarse el cumplimiento de las Formas Normales y un diseo no podr
considerarse correcto hasta comprobar que todas las tablas responden a ellas.
En el pasado reciente, la mayor parte de los diseadores de bases de datos se han auxiliado de estas
tcnicas. Pero, por la dificultad prctica de ir comprobando la verificacin de las Formas Normales,
en la actualidad, ya son muchos los que realizan un primer diseo conceptual, apoyndose en
metodologas como NIAM, ORM, ER o UML, que conduzca al diseo de la base de datos,
asegurando el cumplimiento de las formas normales sin necesidad de un anlisis expreso. Algunos
an utilizan la normalizacin, aunque slo para refinar el esquema relacional obtenido a partir del
esquema conceptual.
Las tcnicas de diseo de bases de datos relacionales basadas en estos mtodos implican el proceso
de conversin de un esquema conceptual, expresado en trminos propios de cada metodologa, en un
esquema relacional cuya presentacin se basa en tablas. La ventaja de esta forma de proceder radica
en trabajar con unidades simples, lo que facilita su correcta eleccin y que las restricciones son
fciles de expresar y comprobar; adems, el mismo esquema conceptual puede ser convertido en
diferentes modelos de datos, dependiendo del gestor de bases de datos que se vaya a utilizar.
En lo que sigue, se presentan las definiciones y conceptos necesarios para comprender las
propiedades exigibles a las tablas de un esquema relacional para que ste no pueda dar lugar a
redundancias y contradicciones en sus datos.
Pg.
-1-
Universidad de Cantabria
Bases de Datos
Las letras maysculas del comienzo del alfabeto representan atributos simples.
2.Las letras maysculas del final del alfabeto representan conjuntos de atributos (atributos
compuestos), siendo posibles conjuntos simples.
3.-
4.-
5.La concatenacin significa unin, es decir: A1A2...An es el conjunto{A1, A2, ..., An}, XY es
lo mismo que X Y y tambin XA es igual que X {A}.
Clave:
Es todo atributo, simple o compuesto, que toma valores nicos (no repetidos). Esto equivale a
decir que, para un esquema de relacin, R, K R es una clave si, para cualquier contenido, r(R), de
la relacin, para todas las parejas t1 y t2 de tuplas de r(R), tales que t1 t2 entonces t1[K] t2[K].
Clave principal:
Es la clave que se utiliza para identificar cada tupla de una relacin.
Atributo de clave (Key atribute):
Es un atributo que pertenece a una clave.
Atributo no de clave (Non key attribute):
Es un atributo que ni es una clave ni forma parte de una clave.
Eduardo Mora y Marta Zorrilla
Pg.
-2-
Universidad de Cantabria
Bases de Datos
Dependencia funcional:
Sean V R y W R, se dice que W depende funcionalmente de V en R, V W, si en
cualquier relacin r(R), para todas las parejas t1 y t2 de tuplas de r(R) tales que t1[V] = t2[V] entonces
t1[W] = t2[W]. Tambin suele decirse que V determina funcionalmente a W.
Del planteamiento directo de cada problema concreto puede observarse un cierto conjunto de
dependencias funcionales entre atributos. Generalmente, hay otras dependencias que pueden
deducirse a partir de las primeras.
Dado un conjunto, F, de dependencias funcionales. El conjunto cerrado de dependencias
funcionales de F, F+, es aquel que contiene todas las dependencias funcionales que F implica
lgicamente. El conjunto cerrado de dependencias funcionales contiene todas las que el problema
implica.
Tres son las reglas que, dado un conjunto de dependencias funcionales, permiten encontrar su
conjunto cerrado y se conocen bajo el nombre de axiomas de Armstrong. stos son
Si Y X X Y
Si X Y WX WY
Si X Y e Y Z X Z
Se dice que estas reglas son vlidas porque no generan dependencias funcionales incorrectas
y son completas porque, dado un conjunto de dependencias funcionales, F, permiten encontrar su
conjunto cerrado, F+.
Su utilizacin prctica suele resultar incomoda, por lo que frecuentemente, junto a ellas, se
utilizan otras reglas deducidas como:
Regla de la descomposicin:
Si X Y y X Z X YZ
Si X YZ X Y y X Z
Regla de la seudotransitividad:
Si X Y y WY Z XW Z
Regla de la unin:
Pg.
-3-
Universidad de Cantabria
Bases de Datos
Una dependencia funcional completa y no trivial se dice que es una dependencia funcional
elemental.
Una clave es una clave elemental si algn atributo en la tabla depende funcionalmente de ella
mediante una dependencia funcional elemental.
PEDIDO
Num_ped
Num_ped Cod_artic
Cod_prov
Num_ped
Cod_artic Unidades_ped
A20
A20
729
729
2745
3752
110
240
B09
...
730
...
3752
...
250
...
Cod_prov
Unidades_ped
Pg.
-4-
Universidad de Cantabria
Bases de Datos
PEDIDO
Cod_prov
Num_ped
A20
729
B09
...
730
...
LINEA_DE_PEDIDO
Num_ped
Cod_artic Unidades_ped
729
729
730
...
2745
3752
3752
...
110
240
250
...
EMPLEADOS
Nombre_empleado
Departamento
Edificio
Nombre_empleado
Departamento
Lpez, Juan
PER
DIR
32
10
PER
...
32
...
Cruz, Pedro
Mas, Luis
...
Edificio
Pg.
-5-
Universidad de Cantabria
Bases de Datos
DEPARTAMENTOS
Departamento
EMPLEADOS
Nombre_empleado
Departamento
Lpez, Juan
PER
DIR
Cruz, Pedro
Mas, Luis
...
Edificio
PER
32
DIR
...
10
...
PER
...
Num_exp,
MATRICULA
Nombre_al Num_exp Cod_asig
Nombre_al
Num_exp
Laso, Ana
Laso, Ana
Mas, Luis
...
32678
32678
2745
3752
25663
3752
...
...
Pg.
-6-
Universidad de Cantabria
Bases de Datos
ALUMNOS
Nombre_al Num_exp
Laso, Ana
32678
Mas, Luis
25663
...
...
MATRICULA
Num_exp Cod_asig
32678
32678
25663
2745
3752
3752
...
...
Num_exp Cod_asig
Nombre_al Cod_asig
Num_exp
Calificacion
Calificacion
Calificacion
Laso, Ana
Laso, Ana
Mas, Luis
...
APROBADO
32678
32678
25663
...
2745
3752
3752
...
NOTABLE
...
No obstante, la tabla presenta la misma redundancia que la tabla anterior. Una forma de
localizar este problema consiste en observar que la tabla no est en BCNF, lo que resulta sencillo al
observar que ni Num_exp ni Nombre_al son claves.
El problema de la redundancia puede evitarse dividiendo la tabla en las dos que se
representan en la figura, las cuales verifican la BCNF.
Pg.
-7-
Universidad de Cantabria
Bases de Datos
ALUMNOS
Nombre_al Num_exp
Laso, Ana
32678
Mas, Luis
...
25663
...
NOTAS
Num_exp Cod_asig Calificacion
32678
32678
25663
...
2745
3752
3752
...
APROBADO
NOTABLE
...
Para que un esquema de relacin est en 3NF o en EKNF pero no en BCNF es preciso que existan
dos claves que se solapen.
Se demuestra que si una tabla est en BCNF tambin est en EKNF y que, si est en EKNF tambin
est en 3NF.
* En la definicin original de Codd de 2NF y 3NF aparece el termino clave en el sentido de clave
principal y candidata a clave en el de clave. En la actualidad, un atributo se considera atributo
de clave si pertenece a una clave (clave principal) o a una candidata a clave (clave).
Dependencia de valores mltiples:
Las dependencias de valores mltiples o multivaluadas, V W, se definen sobre una
relacin y son una generalizacin de las dependencias funcionales. En ellas, para cada valor de V
existen un conjunto de valores de W con independencia del resto de atributos de la relacin.
En el ejemplo que se propone en la figura, PROFESOR e IDIOMA, son atributos con mltiples
valores para un mismo valor del DEPORTE, independientes entre s. Se ha supuesto que en la realidad
(ver esquema de datos) existe una regla que obliga a que todos los profesores de un deporte han de
utilizar todos los idiomas correspondientes a l.
DEPORTE
PROFESOR
IDIOMA
TENIS
PEDRO
ESPAOL
LUIS
INGLES
LUIS
FRANCES
GOLF
CARLOS
Esquema de datos.
Por lo que, al normalizar hasta BCNF, la relacin que recoja estos datos debe responder al
esquema de la siguiente figura. As, deben aparecer todas las posibles combinaciones entre los
valores de los atributos PROFESOR e IDIOMA, correspondientes a cada valor de DEPORTE .
Pg.
-8-
Universidad de Cantabria
Bases de Datos
Deporte Profesor
R-V-W
Idioma
Tenis
Pedro
Espaol
Tenis
Tenis
Pedro
Luis
Ingls
Ingls
Tenis
Luis
Espaol
Golf
Golf
Luis
Carlos
Francs
Francs
t4
t1
t3
t2
t1[V]=t2[V]=t3[V]=t4[V]
ii)
t3[W]=t2[W] y t3[R-V-W]=t1[R-V-W]
iii)
t4[W]=t1[W] y t4[R-V-W]=t2[R-V-W]
Reglas de inferencia:
Pg.
-9-
Universidad de Cantabria
Bases de Datos
Si Y X X Y
Si X Y WX WY
Si X Y e Y Z X Z
4.- Regla de la complementacin (complementation): Si X Y X R-Y-Z
3.- Regla de la transitividad (transitivity):
Deporte
Profesor
Deporte
Idioma
Tenis
Pedro
Tenis
Espaol
Tenis
Luis
Tenis
Ingls
Golf
Luis
Golf
Francs
Golf
Carlos
Dependencia de combinacin:
Pg.
- 10 -
Universidad de Cantabria
Bases de Datos
Una relacin tiene una dependencia de combinacin si puede ser reconstruida sin prdida de
informacin a partir una combinacin de algunas de sus proyecciones. Si una de esas proyecciones es
la propia tabla, entonces se trata de una dependencia de combinacin trivial.
En la figura se presenta una tabla de vendedores-aparatos-marcas. En el segundo nivel se
presentan sus proyecciones binarias y, a continuacin, su combinacin, realizada en dos fases. Como
el resultado vuelve a ser la tabla de partida, la relacin presenta una dependencia de combinacin y,
como ninguna de las proyecciones es la propia tabla, sta es no trivial.
No obstante, pese a estar en 4NF, en la tabla se observan redundancias que hacen pensar que
su composicin no es la adecuada. Este tipo de dificultad puede ser detectado analizando el
cumplimiento de la quinta forma normal, que se define a continuacin.
Vendedor
Aparato
Luis
Luis
Luis
Pedro
Vendedor
Aparato
Luis
Luis
TV
PC
Pedro
TV
Vendedor
1 - 1
1 - 2
2 - 1
2 - 1
3 - 3
Luis
Luis
Luis
Luis
Pedro
TV
PC
TV
TV
Vendedor
Luis
Luis
Pedro
Aparato
TV
TV
PC
PC
TV
Marca
Sony
Sony
Loewe
Sony
Marca
Sony
Loewe
Sony
TV
PC
TV
Marca
Sony
Sony
Loewe
Marca
Sony
Loewe
Sony
Loewe
Sony
FALSA
Vendedor
1 - 1
3 - 2
2 - 3
5 - 2
Aparato
Luis
Luis
Luis
Pedro
Aparato
TV
PC
TV
TV
Marca
Sony
Sony
Loewe
Sony
Pg.
- 11 -
Universidad de Cantabria
Bases de Datos
Pg.
- 12 -