Está en la página 1de 5

Reglas de normalización

El punto de partida del proceso de normalización es un conjunto de tablas


con sus atributos, el denominado esquema relacional. Se pretende mejorar
dicho esquema de datos. Se dice que una tabla está en una determinada
forma normal si satisface un cierto número de restricciones impuestas por la
correspondiente regla de normalización. La aplicación de una de estas reglas
a un esquema relacional produce un nuevo esquema relacional en el que no
se ha introducido ningún nuevo atributo.
Si una tabla no satisface una determinada regla de normalización, se procede
a descomponerla en otras dos nuevas que sí las satisfagan. Esto usualmente
requiere decidir qué atributos de la tabla original van a residir en una u otra
de las nuevas tablas. La descomposición tiene que conservar dos propiedades
fundamentales:
1.No pérdida de información.
2.No pérdida de dependencias funcionales.

La normalización consiste pues en descomponer los esquemas relacionales


(tablas) en otros equivalentes (puede obtenerse el original a partir de los
otros) de manera que se verifiquen unas determinadas reglas de
normalización. Evidentemente las reglas de normalización imponen una serie
de restricciones en lo relativo a la existencia de determinados esquemas
relacionales. Según se avance en el cumplimiento de reglas y restricciones se
alcanzará una mayor forma normal.
Existen cinco formas normales hacia las cuales puede conducir el proceso de
normalización de forma incremental más una forma normal independiente de
las otras.
Un esquema relacional que satisface todas las restricciones impuestas por la
tercera forma normal se considera de buena calidad aunque es mejor que
satisfaga una interesante propiedad. La verificación de una forma normal
implica el cumplimiento de todas las formas normales anteriores. La primera
forma normal es de cumplimiento obligatorio para que exista siquiera un
esquema relacional propiamente formado.
El proceso de normalización consiste en aplicar una serie de reglas a las
relaciones obtenidas tras el paso del modelo entidad-relación al modelo
relacional.
Las bases de datos relacionales se normalizan para:
o Evitar la redundancia de los datos.
o Disminuir problemas de actualización de los datos en las tablas.
o Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para
que una tabla sea considerada como una relación tiene que cumplir con
algunas restricciones:
o Cada tabla debe tener su nombre único.
o No puede haber dos filas iguales. No se permiten los duplicados.
o Todos los datos en una columna deben ser del mismo tipo.

Primera Forma Normal (1FN)

Una relación está en primera forma normal cuando todos sus atributos son
atómicos. Una tabla está en Primera Forma Normal si:

o Todos los atributos son atómicos. Un atributo es atómico si los elementos


del dominio son indivisibles, mínimos. Todos los atributos son
“atómicos”. Por ejemplo, en el campo teléfono no tenemos varios
teléfonos.
o La tabla contiene una clave primaria única. La tabla contiene una clave
primaria única. Por ejemplo el NIF para personas, la matrícula para
vehículos o un simple id autoincremental. Si no tiene clave, no es 1FN.
o La clave primaria no contiene atributos nulos. La clave primaria no
contiene atributos nulos. No podemos tener filas para las que no haya
clave (por ejemplo, personas sin NIF o vehículos sin matrícula).
o No debe existir variación en el número de columnas. No debe existir
variación en el número de columnas. Si algunas filas tienen 8
columnas y otras 3, pues no estamos en 1FN.
o Los Campos no clave deben identificarse por la clave (Dependencia
Funcional) Los campos no clave deben identificarse por la clave. Es
decir, que los campos no clave dependen funcionalmente de la clave. Esto
es prácticamente lo mismo que decir que existe clave primaria.
o Debe Existir una independencia del orden tanto de las filas como de las
columnas, es decir, si los datos cambian de orden no deben cambiar sus
significados
o Una tabla no puede tener múltiples valores en cada columna. Debe
Existir una independencia del orden tanto de las filas como de las
columnas, es decir, si los datos cambian de orden no deben cambiar sus
significados. Por ejemplo, si en la columna 1 tenemos el primer apellido y
en la columna 2 tenemos el segundo, pues no estamos en 1FN.
Igualmente si en la tercera fila tenemos el tercer mejor expediente y en
la quinta fila el quinto, no estamos en 1FN.
o Los datos son atómicos (a cada valor de X le pertenece un valor de Y y
viceversa).

Esta forma normal elimina los valores repetidos dentro de una BD

Segunda Forma Normal (2FN)

Una relación está en 2FN si está en 1FN y si los atributos que no forman parte
de ninguna clave dependen de forma completa de la clave principal. Es decir
que no existen dependencias parciales. (Todos los atributos que no son clave
principal deben depender únicamente de la clave principal).

En otras palabras podríamos decir que la segunda forma normal está basada
en el concepto de dependencia completamente funcional. Una dependencia
funcional es completamente funcional si al eliminar los atributos A de X
significa que la dependencia no es mantenida, esto es que . Una dependencia
funcional es una dependencia parcial si hay algunos atributos que pueden
ser eliminados de X y la dependencia todavía se mantiene, esto es

Por ejemplo {DNI, ID_PROYECTO} HORAS_TRABAJO (con el DNI de un


empleado y el ID de un proyecto sabemos cuántas horas de trabajo por
semana trabaja un empleado en dicho proyecto) es completamente funcional
dado que ni DNI HORAS_TRABAJO ni ID_PROYECTO HORAS_TRABAJO
mantienen la dependencia. Sin embargo {DNI,
ID_PROYECTO} NOMBRE_EMPLEADO es parcialmente dependiente dado que
DNI NOMBRE_EMPLEADO mantiene la dependencia.

Una tabla está en 2FN si además de estar en 1FN cumple que los atributos
no clave depende de TODA la clave principal.

Por ejemplo, si tenemos una tabla con Personas, identificadas por su NIF y
recogemos su empresa y dirección de trabajo, la clave sería NIF-Empresa.
Pero nos encontraremos con que una misma persona puede trabajar en varias
empresas. Y vemos que la dirección de trabajo no depende de TODA la clave
primaria, sino solo de la empresa. Por lo tanto, no estamos en 2FN.

Tercera Forma Normal (3FN)

La tabla se encuentra en 3FN si es 2FN y si no existe ninguna dependencia


funcional transitiva entre los atributos que no son clave.

Un ejemplo de este concepto sería que, una dependencia funcional X->Y en


un esquema de relación R es una dependencia transitiva si hay un conjunto
de atributos Z que no es un subconjunto de alguna clave de R, donde se
mantiene X->Z y Z->Y.
Por ejemplo, la dependencia SSN->DMGRSSN es una dependencia transitiva
en EMP_DEPT de la siguiente figura. Decimos que la dependencia de
DMGRSSN el atributo clave SSN es transitiva vía DNUMBER porque las
dependencias SSN→DNUMBER y DNUMBER→DMGRSSN son mantenidas, y
DNUMBER no es un subconjunto de la clave de EMP_DEPT. Intuitivamente,
podemos ver que la dependencia de DMGRSSN sobre DNUMBER es indeseable
en EMP_DEPT dado que DNUMBER no es una clave de EMP_DEPT.

Formalmente, un esquema de relación está en 3 Forma Normal Elmasri-


Navathe, si para toda dependencia funcional , se cumple al menos una de las
siguientes condiciones:

es superllave o clave.

es atributo primo de ; esto es, si es miembro de alguna clave en .

Además el esquema debe cumplir necesariamente, con las condiciones de


segunda forma normal.

3FN – Tercera Forma Normal

Una tabla está en 3FN si además de estar en 2FN no existe ninguna


dependencia transitiva entre los atributos que no son clave.

Vamos a explicarlo. Como dijo Bill Kent, “todo atributo no clave debe
proporcionar información sobre la clave, sobre toda la clave y nada más que
la clave… con la ayuda de Codd”.

Bueno, en serio, supongamos que tenemos una tabla de ganadores de


torneos de tenis. En ella figura el nombre del torneo, el año, el nombre del
ganador y su nacionalidad. La clave sería Torneo-Año. Pues esta tabla no está
en 3FN porque el atributo nacionalidad, que no es de la clave, depende del
nombre del ganador (también depende de la clave). Digamos que
nacionalidad aporta información sobre el ganador, pero no sobre la clave. Es
una dependencia transitiva porque nacionalidad depende de ganador que

Formas Normales de Alto Nivel

Cuarta Forma Normal (4FN)

Una tabla se encuentra en 4FN si, y sólo si, para cada una de sus dependencias
múltiples no funcionales X->->Y, siendo X una super-clave que, X es o una clave
candidata o un conjunto de claves primarias.

Quinta Forma Normal (5FN)

Una tabla se encuentra en 5FN si:

La tabla esta en 4FN


No existen relaciones de dependencias no triviales que no siguen los criterios de
las claves. Una tabla que se encuentra en la 4FN se dice que esta en la 5FN si, y
sólo si, cada relación de dependencia se encuentra definida por las claves
candidatas.

Función de la Normalización en el Proceso de Desarrollo de la Base de Datos

El proceso de normalización de bases de datos consiste en aplicar una serie


de reglas a las relaciones obtenidas tras el paso del modelo entidad-
relación al modelo relacional.
Las bases de datos relacionales se normalizan para:

Evitar la redundancia de los datos.

Evitar problemas de actualización de los datos en las tablas.

Proteger la integridad de los datos.

En el modelo relacional es frecuente llamar tabla a una relación, aunque


para que una tabla sea considerada como una relación tiene que cumplir
con algunas restricciones:

Cada tabla debe tener su nombre único.

No puede haber dos filas iguales. No se permiten los duplicados.

Todos los datos en una columna deben ser del mismo tipo.

También podría gustarte