Está en la página 1de 6

Normalizacin de Datos

Cuando trabajamos con una base de datos relacional, los esquemas de las distintas relaciones que la constituyen nos indican que cada dato tiene su lugar. Pero, qu ocurre si se modifican estas estructuras lgicas? . Muchas veces es tan obvio que un dato debe de almacenarse en una de las relaciones y no en otra que se nos escapa la respuesta a porqu es as. Concepto: La teora de la normalizacin es en esencia una expresin formal de ideas sencillas con una aplicacin muy prctic a en el rea del diseo de bases de datos, ya que conducen a una correcta eleccin del esquema de la base de datos. Es la simplificacin de los datos dentro de los campos de registro, este proceso lo considero importante ya que nos ayuda a dejar datos en estado demasiado simple de una forma entendible precisa, predecible y manejable. La normalizacin permite estructurar datos de forma precisa para representar las relaci ones necesarias entre los campos de un registro, tambin permite la recuperacin de dato s sencillos que se pierden al realizar consultas y reportes.

Universo de las relaciones (normalizadas y no normalizadas) Relaciones 1FN Normalizadas Codd Relaciones 2FN Normalizadas Codd Relaciones 3FN Normalizadas Codd Relaciones BCFN Boyce Codd Relaciones 4FN Fagin Relaciones 5FN Fagin

Visin de la Teora de Normalizacin


Las bases de datos relacionales se normalizan para:

Evitar la redundancia de los datos. Evitar problemas de actualizacin de los datos en las tablas. Proteger la integridad de los datos.

Hablaremos de las 3 primeras formas de normalizacin bsic a para el diseo de una base de datos.

Geynen Rossler Montenegro Cochas

Pgina 1

PRIMERA FORMA NORMAL: Una relacin est en primera forma normal (1FN) si y slo si todos los dominios simples subyacentes contienen s lo valores atmicos. La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse y colocarse en tablas separadas. Poner la base de datos en la Primera Forma Normal resuelve el problema de los encabezados de columna mltiples . SEGUNDA FORMA NORMA: Una relacin est en segunda forma normal (2FN) si y slo si est en 1FN y todos los atributos no clave dependen por completo de cualquier clave candidata. La regla de la Segunda Forma Normal establece que todas las dependencias p arciales se deben eliminar y separar dentro de sus propias tablas. Una dependencia parcial es un trmino que describe a aquellos datos que no dependen de la llave primaria de la tabla para identificarlos. TERCERA FORMA NORMA : Una relacin est en tercera forma normal (3FN) si y slo si est en 2FN y todos los atributos no clave dependen de manera no transitiva de cualquier clave candidata. Una tabla est normalizada en esta forma si todas las columnas que no son llave son funcionalmente dependientes por c ompleto de la llave primaria y no hay dependencias transitivas. Una dependencia transitiva es aquella en la cual existen columnas que no son llave que dependen de otras columnas que tampoco son llave. EJEMPLO: A travs del siguiente ejercicio se intenta afirmar los conocimientos de normalizacin con un ejemplo simplificado de una base de datos para una pequea biblioteca.
CodLibro 1001 1004 1005 1006 1007 Titulo Variable compleja Visual Basic 5 Estadstica Oracle University Clipper 5.01 Autor Murray Spiegel E. Petroustsos Murray Spiegel Nancy Greenberg y Priya Nathan Ramalho Editorial McGraw Hill Anaya McGraw Hill Oracle Corp. McGraw Hill NombreLector Prez Gmez, Juan Ros Tern, Ana Roca, Ren Garca Roque, Luis Prez Gmez, Juan FechaDev 15/04/2005 17/04/2005 16/04/2005 20/04/2005 18/04/2005

Esta tabla no cumple el requisito de la Primera Forma Normal (1NF) de slo tener campos atmicos, pues el nombre del lector es un campo que puede (y conviene) descomponerse en apellido pat erno, apellido materno y nombres. Tal como se muestra en la siguiente tabla. 1NF
CodLibro 1001 1004 1005 1006 Titulo Variable compleja Visual Basic 5 Estadstica Oracle University Autor Murray Spiegel E. Petroustsos Murray Spiegel Nancy Greenberg Editorial McGraw Hill Anaya McGraw Hill Oracle Corp. Paterno Prez Ros Roca Garca Roque Materno Gmez Tern Nombres Juan Ana Ren Luis FechaDev 15/04/2005 17/04/2005 16/04/2005 20/04/2005

Geynen Rossler Montenegro Cochas

Pgina 2

1006 1007

Oracle University Clipper 5.01

Priya Nathan Ramalho

Oracle Corp. McGraw Hill

Garca Prez

Roque Gmez

Luis Juan

20/04/2005 18/04/2005

Como se puede ver, hay cierta redundancia caracterstica de 1NF. La Segunda Forma Normal (2NF) pide que no existan dependencias parciales o dicho de otra manera, todos los a tributos no clave deben depender por completo de la clave primaria. Actualmente en nuestra tabla tenemos varias consideramos como atributo clave el cdigo del libro. dependencias parciales si

Por ejemplo, el ttulo es completamente id entificado por el cdigo del libro, pero el nombre del lector en realidad no tiene dependencia de este cdigo, por tanto estos datos deben ser trasladados a otra tabla. 2NF
CodLibro 1001 1004 1005 1006 1006 1007 Titulo Variable compleja Visual Basic 5 Estadstica Oracle University Oracle University Clipper 5.01 Autor Murray Spiegel E. Petroustsos Murray Spiegel Nancy Greenberg Priya Nathan Ramalho Editorial McGraw Hill Anaya McGraw Hill Oracle Corp. Oracle Corp. McGraw Hill

La nueva tabla slo contendr datos del lector.


CodLector 501 502 503 504 Paterno Prez Ros Roca Garca Roque Materno Gmez Tern Nombres Juan Ana Ren Luis

Hemos creado una tabla para contener los datos del lector y tambin tuvimos que crear la columna CodLector para identificar unvocamente a cada uno. Sin embargo, esta nueva disposicin de la base de datos necesita que exista otra tabla para mantener la informacin de qu libros estn prestados a qu lectores. Esta tabla se muestr a a continuacin:
CodLibro 1001 1004 1005 1006 1007 CodLector 501 502 503 504 501 FechaDev 15/04/2005 17/04/2005 16/04/2005 20/04/2005 18/04/2005

Para la Tercera Forma Normal (3NF) la relacin debe estar en 2NF y adems los atributos no clave deben ser mutuamente independientes y dependientes por completo de la clave primaria. Tambin recordemos que dijimos que esto significa que las columnas Geynen Rossler Montenegro Cochas Pgina 3

en la tabla deben contener solamente informacin sobre la entidad definida por la clave primaria y, por tanto, las columnas en la tabla deben contener datos acerca de una sola cosa. En nuestro ejemplo en 2NF, la primera tabla conserva informacin acerca del libro, los autores y editoriales, por lo que debemos crear nuevas tablas para satisfacer los requisitos de 3NF. 3NF
CodLibro 1001 1004 1005 1006 1007 Titulo Variable compleja Visual Basic 5 Estadstica Oracle University Clipper 5.01

CodAutor 801 802 803 804 806

Autor Murray Spiegel E. Petroustsos Nancy Greenberg Priya Nathan Ramalho

CodEditorial 901 902 903

Editorial McGraw Hill Anaya Oracle Corp.

Aunque hemos creado nuevas tablas para que cada una tenga slo informacin acerca de una entidad, tambin hemos perdido la informacin acerca de qu autor ha escrito qu libro y las editoriales correspondientes, por lo que debemos crear otras tablas que relacionen cada libro con sus autores y editoriales.
CodLibro 1001 1004 1005 1006 1006 1007 codAutor 801 802 801 803 804 806

CodLibro 1001 1004 1005 1006

codEditorial 901 902 901 903

Geynen Rossler Montenegro Cochas

Pgina 4

1007

901

Y el resto de las tablas no necesitan modificacin.


CodLector 501 502 503 504 Paterno Prez Ros Roca Garca Roque Materno Gmez Tern Nombres Juan Ana Ren Luis

CodLibro 1001 1004 1005 1006 1007

CodLector 501 502 503 504 501

FechaDev 15/04/2005 17/04/2005 16/04/2005 20/04/2005 18/04/2005

Geynen Rossler Montenegro Cochas

Pgina 5

BIBLIOGRAFIA

Libros en pantalla de SQL Server 2005.

Geynen Rossler Montenegro Cochas

Pgina 6