Está en la página 1de 6

Geynen Rossler Montenegro Cochas Pgina1

Normalizacin de Datos
Cuando trabajamos con una base de datos relacional, los esquemas de las distintas
relaciones que la constituyen nos indican que cada dato tiene su lugar. Pero, qu ocurre si
se modifican estas estructuras lgicas? . Muchas veces es tan obvio que un dato debe de
almacenarse en una de las relaciones y no en otra que se nos escapa la respuesta a porqu es
as.
Concepto:
La teora de la normalizacin es en esencia una expresin formal de ideas sencillas
con una aplicacin muy prctica en el rea del diseo de bases de datos, ya que conducen a
una correcta eleccin del esquema de la base de datos.
Es la simplificacin de los datos dentro de los campos de registro, este proceso lo
considero importante ya que nos ayuda a dejar datos en estado demasiado simple de una
forma entendible precisa, predecible y manejable. La normalizacin permite estructurar datos
de forma precisa para representar las relaci ones necesarias entre los campos de un registro,
tambin permite la recuperacin de datos sencillos que se pierden al realizar consultas y
reportes.
Las bases de datos relacionales se normalizan para:
Evitar la redundancia de los datos.
Evitar problemas de actualizacin de los datos en las tablas.
Proteger la integridad de los datos.
Hablaremos de las 3 primeras formas de normalizacin bsica para el diseo de una
base de datos.
Universo de las relaciones (normalizadas y no normalizadas)
Relaciones 1FN Normalizadas Codd
Relaciones 2FN Normalizadas Codd
Relaciones 3FN Normalizadas Codd
Relaciones BCFN Boyce Codd
Relaciones 4FN Fagin
Relaciones 5FN Fagin
Visin de la Teora de Normalizacin
Geynen Rossler Montenegro Cochas Pgina2
PRIMERA FORMA NORMAL: Una relacin est en primera forma normal (1FN) si y
slo si todos los dominios simples subyacentes contienen s lo valores atmicos.
La regla de la Primera Forma Normal establece que las columnas repetidas deben
eliminarse y colocarse en tablas separadas.
Poner la base de datos en la Primera Forma Normal resuelve el problema de los
encabezados de columna mltiples .
SEGUNDA FORMA NORMA: Una relacin est en segunda forma normal (2FN) si y slo
si est en 1FN y todos los atributos no clave dependen por completo de cualquier clave
candidata.
La regla de la Segunda Forma Normal establece que todas las dependencias p arciales
se deben eliminar y separar dentro de sus propias tablas. Una dependencia parcial es un
trmino que describe a aquellos datos que no dependen de la llave primaria de la tabla para
identificarlos.
TERCERA FORMA NORMA: Una relacin est en tercera forma normal (3FN) si y slo
si est en 2FN y todos los atributos no clave dependen de manera no transitiva de cualquier
clave candidata.
Una tabla est normalizada en esta forma si todas las columnas que no son llave son
funcionalmente dependientes por c ompleto de la llave primaria y no hay dependencias
transitivas. Una dependencia transitiva es aquella en la cual existen columnas que no son
llave que dependen de otras columnas que tampoco son llave.
EJEMPLO:
A travs del siguiente ejercicio se intenta afirmar los conocimientos de normalizacin
con un ejemplo simplificado de una base de datos para una pequea biblioteca.
CodLibro Titulo Autor Editorial NombreLector FechaDev
1001 Variable compleja Murray Spiegel McGraw Hill Prez Gmez, Juan 15/04/2005
1004 Visual Basic 5 E. Petroustsos Anaya Ros Tern, Ana 17/04/2005
1005 Estadstica Murray Spiegel McGraw Hill Roca, Ren 16/04/2005
1006 Oracle University
Nancy Greenberg y
Priya Nathan
Oracle Corp. Garca Roque, Luis 20/04/2005
1007 Clipper 5.01 Ramalho McGraw Hill Prez Gmez, Juan 18/04/2005
Esta tabla no cumple el requisito de la Primera Forma Normal (1NF) de slo
tener campos atmicos, pues el nombre del lector es un campo que puede (y conviene)
descomponerse en apellido pat erno, apellido materno y nombres. Tal como se muestra en la
siguiente tabla.
1NF
CodLibro Titulo Autor Editorial Paterno Materno Nombres FechaDev
1001 Variable compleja Murray Spiegel McGraw Hill Prez Gmez Juan 15/04/2005
1004 Visual Basic 5 E. Petroustsos Anaya Ros Tern Ana 17/04/2005
1005 Estadstica Murray Spiegel McGraw Hill Roca Ren 16/04/2005
1006 Oracle University Nancy Greenberg Oracle Corp. Garca Roque Luis 20/04/2005
Geynen Rossler Montenegro Cochas Pgina3
1006 Oracle University Priya Nathan Oracle Corp. Garca Roque Luis 20/04/2005
1007 Clipper 5.01 Ramalho McGraw Hill Prez Gmez Juan 18/04/2005
Como se puede ver, hay cierta redundancia caracterstica de 1NF.
La Segunda Forma Normal (2NF) pide que no existan dependencias parciales o dicho
de otra manera, todos los atributos no clave deben depender por completo de la clave
primaria.
Actualmente en nuestra tabla tenemos varias dependencias parciales si
consideramos como atributo clave el cdigo del libro.
Por ejemplo, el ttulo es completamente id entificado por el cdigo del libro, pero el
nombre del lector en realidad no tiene dependencia de este cdigo, por tanto estos
datos deben ser trasladados a otra tabla.
2NF
CodLibro Titulo Autor Editorial
1001 Variable compleja Murray Spiegel McGraw Hill
1004 Visual Basic 5 E. Petroustsos Anaya
1005 Estadstica Murray Spiegel McGraw Hill
1006 Oracle University Nancy Greenberg Oracle Corp.
1006 Oracle University Priya Nathan Oracle Corp.
1007 Clipper 5.01 Ramalho McGraw Hill
La nueva tabla slo contendr datos del lector.
CodLector Paterno Materno Nombres
501 Prez Gmez Juan
502 Ros Tern Ana
503 Roca Ren
504 Garca Roque Luis
Hemos creado una tabla para contener los datos del lector y tambin tuvimos
que crear la columna CodLector para identificar unvocamente a cada uno. Sin
embargo, esta nueva disposicin de la base de datos necesita que exista otra tabla para
mantener la informacin de qu libros estn prestados a qu lectores. Esta tabla se muestr a a
continuacin:
CodLibro CodLector FechaDev
1001 501 15/04/2005
1004 502 17/04/2005
1005 503 16/04/2005
1006 504 20/04/2005
1007 501 18/04/2005
Para la Tercera Forma Normal (3NF) la relacin debe estar en 2NF y adems los
atributos no clave deben ser mutuamente independientes y dependientes por completo de la
clave primaria. Tambin recordemos que dijimos que esto significa que las columnas
Geynen Rossler Montenegro Cochas Pgina4
en la tabla deben contener solamente informacin sobre la entidad definida por la clave
primaria y, por tanto, las columnas en la tabla deben contener datos acerca de una sola cosa.
En nuestro ejemplo en 2NF, la primera tabla conserva informacin acerca del libro,
los autores y editoriales, por lo que debemos crear nuevas tablas para satisfacer los requisitos
de 3NF.
3NF
CodLibro Titulo
1001 Variable compleja
1004 Visual Basic 5
1005 Estadstica
1006 Oracle University
1007 Clipper 5.01
CodAutor Autor
801 Murray Spiegel
802 E. Petroustsos
803 Nancy Greenberg
804 Priya Nathan
806 Ramalho
CodEditorial Editorial
901 McGraw Hill
902 Anaya
903 Oracle Corp.
Aunque hemos creado nuevas tablas para que cada una tenga slo informacin acerca
de una entidad, tambin hemos perdido la informacin acerca de qu autor ha escrito qu
libro y las editoriales correspondientes, por lo que debemos crear otras tablas que relacionen
cada libro con sus autores y editoriales.
CodLibro codAutor
1001 801
1004 802
1005 801
1006 803
1006 804
1007 806
CodLibro codEditorial
1001 901
1004 902
1005 901
1006 903
Geynen Rossler Montenegro Cochas Pgina5
1007 901
Y el resto de las tablas no necesitan modificacin.
CodLector Paterno Materno Nombres
501 Prez Gmez Juan
502 Ros Tern Ana
503 Roca Ren
504 Garca Roque Luis
CodLibro CodLector FechaDev
1001 501 15/04/2005
1004 502 17/04/2005
1005 503 16/04/2005
1006 504 20/04/2005
1007 501 18/04/2005
Geynen Rossler Montenegro Cochas Pgina6
BIBLIOGRAFIA
Libros en pantalla de SQL Server 2005.

También podría gustarte