Está en la página 1de 18

NORMALIZACION DE

DATOS
ANDREA CATALINA
GALLEGO GONZALEZ
INTRODUCCIN
El proceso de normalizacin de bases de datos consiste
en aplicar una serie de reglas a las relaciones obtenidas
tras el paso del modelo entidad-relacin al modelo
relacional.
Las bases de datos relacionales se normalizan para:
Evitar la redundancia de los datos.
Evitar problemas de actualizacin de los datos en las
tablas.
Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una
relacin, aunque para que una tabla sea considerada como
una relacin tiene que cumplir con algunas restricciones:
Cada columna debe tener su nombre nico.
No puede haber dos filas iguales. No se permiten los
duplicados.
Todos los datos en una columna deben ser del mismo tipo.




CLAVES
Una clave primaria es aquella columna (pueden ser
tambin dos columnas o ms) que identifica
nicamente a esa fila. La clave primaria es un
identificador que va a ser nico para cada fila. Se
acostumbra poner la clave primaria como la primera
columna de la tabla pero esto no tiene que ser
necesario, si no es ms una conveniencia. Muchas
veces la clave primaria es autonumrica
En una tabla puede que tengamos ms de una clave,
en tal caso se puede escoger una para ser la clave
primaria, las dems claves son las claves
candidatas.adems es la posible clave primaria.


Una clave fornea es aquella columna que existiendo
como dependiente en una tabla, es a su vez clave
primaria en otra tabla.
Una clave alternativa es aquella clave candidata que
no ha sido seleccionada como clave primaria, pero que
tambin puede identificar de forma nica a una fila
dentro de una tabla. Ejemplo: Si en un tabla clientes
definimos el nmero de documento (id_cliente) como
clave primaria, el nmero de seguro social de ese cliente
podra ser una clave alternativa. En este caso no se us
como clave primaria porque es posible que no se
conozca ese datos en todos los clientes.
Una clave compuesta es una clave que est
compuesta por ms de una columna.

Normalizacin de datos
A travs del siguiente ejercicio se intenta afirmar los conocimientos
de normalizacin con un ejemplo simplificado de una base de datos
para una pequea biblioteca.

CodLibr
o
Titulo Autor Editorial NombreLecto
r
FechaD
ev
1001
Variable
compleja
Murray
Spiegel
McGraw
Hill
Prez Gmez,
Juan
15/04/2
005
1004 Visual Basic 5
E.
Petroustsos
Anaya
Ros Tern,
Ana
17/04/2
005
1005 Estadstica
Murray
Spiegel
McGraw
Hill
Roca, Ren
16/04/2
005
1006
Oracle
University
Nancy
Greenberg y
Priya Nathan
Oracle
Corp.
Garca Roque,
Luis
20/04/2
005
1007 Clipper 5.01 Ramalho
McGraw
Hill
Prez Gmez,
Juan
18/04/2
005
Normalizacin de datos
Esta tabla no cumple el requisito de la
Primera Forma Normal (1NF) de slo
tener campos atmicos, pues el
nombre del lector es un campo que
puede (y conviene) descomponerse en
apellido paterno, apellido materno y
nombres. Tal como se muestra en la
siguiente tabla.
Normalizacin de datos
CodLibro Titulo Autor Editorial Paterno Materno Nombres FechaDev
1001 Variable compleja Murray Spiegel McGraw Hill Prez Gmez Juan 15/04/2005
1004 Visual Basic 5 E. Petroustsos Anaya Ros Tern Ana 17/04/2005
1005 Estadstica Murray Spiegel McGraw Hill Roca Ren 16/04/2005
1006 Oracle University Nancy Greenberg Oracle Corp. Garca Roque Luis 20/04/2005
1006 Oracle University Priya Nathan Oracle Corp. Garca Roque Luis 20/04/2005
1007 Clipper 5.01 Ramalho McGraw Hill Prez Gmez Juan 18/04/2005
Como se puede ver, hay cierta redundancia
caracterstica de 1NF.
La Segunda Forma Normal (2NF) pide que
no existan dependencias parciales o dicho de
otra manera, todos los atributos no clave
deben depender por completo de la clave
primaria. Actualmente en nuestra tabla
tenemos varias dependencias parciales si
consideramos como atributo clave el cdigo
del libro.
Por ejemplo, el ttulo es completamente
identificado por el cdigo del libro, pero el
nombre del lector en realidad no tiene
dependencia de este cdigo, por tanto estos
datos deben ser trasladados a otra tabla.
Normalizacin de datos
CodLibro Titulo Autor Editorial
1001 Variable compleja Murray Spiegel McGraw Hill
1004 Visual Basic 5 E. Petroustsos Anaya
1005 Estadstica Murray Spiegel McGraw Hill
1006 Oracle University Nancy Greenberg Oracle Corp.
1006 Oracle University Priya Nathan Oracle Corp.
1007 Clipper 5.01 Ramalho McGraw Hill
Normalizacin de datos
CodLector Paterno Materno Nombres
501 Prez Gmez Juan
502 Ros Tern Ana
503 Roca Ren
504 Garca Roque Luis
La nueva tabla slo contendr datos del lector.
Normalizacin de datos
Hemos creado una tabla para contener los
datos del lector y tambin tuvimos que
crear la columna CodLector para
identificar unvocamente a cada uno. Sin
embargo, esta nueva disposicin de la
base de datos necesita que exista otra
tabla para mantener la informacin de qu
libros estn prestados a qu lectores. Esta
tabla se muestra a continuacin:

CodLibro CodLector FechaDev
1001 501 15/04/2005
1004 502 17/04/2005
1005 503 16/04/2005
1006 504 20/04/2005
1007 501 18/04/2005
Para la Tercera Forma Normal (3NF) la relacin
debe estar en 2NF y adems los atributos no
clave deben ser mutuamente independientes y
dependientes por completo de la clave primaria.
Tambin recordemos que dijimos que esto
significa que las columnas en la tabla deben
contener solamente informacin sobre la
entidad definida por la clave primaria y, por
tanto, las columnas en la tabla deben contener
datos acerca de una sola cosa.
En nuestro ejemplo en 2NF, la primera tabla
conserva informacin acerca del libro, los
autores y editoriales, por lo que debemos crear
nuevas tablas para satisfacer los requisitos de
3NF.
CodLibro Titulo
1001
Variable compleja
1004
Visual Basic 5
1005
Estadstica
1006
Oracle University
1007
Clipper 5.01
CodAutor Autor
801 Murray Spiegel
802 E. Petroustsos
803 Nancy Greenberg
804 Priya Nathan
806 Ramalho
CodEditorial Editorial
901
McGraw Hill
902
Anaya
903
Oracle Corp.
Aunque hemos creado nuevas tablas para que
cada una tenga slo informacin acerca de una
entidad, tambin hemos perdido la informacin
acerca de qu autor ha escrito qu libro y las
editoriales correspondientes, por lo que
debemos crear otras tablas que relacionen cada
libro con sus autores y editoriales
VENTAJAS
Integridad de datos (porque no hay datos
redundantes ni omitidos).
Consultas optimizadas (porque las tablas
normalizadas generan combinaciones eficaces y
rpidas).
Creacin y ordenacin de ndices ms rpidas
(porque las tablas tienen menos columnas).
Ejecucin ms rpida de la instruccin UPDATE
(porque hay menos ndices por tabla).
Resolucin de concurrencias mejorada (porque
los bloqueos de tabla afectarn a menos datos).