QUÉ ES LA NORMALIZACIÓN • Es una técnica para diseñar la estructura lógica de los datos para un sistema de información, desarrollada por el autor E.F. Codd en 1972, el cual plantea que se identifiquen atributos y se agrupen en relaciones (tablas) según como lo indique las reglas del negocio.
• La normalización se realiza en una serie de pasos, cada
uno de ellos corresponde a una forma normal que tiene unas propiedades. Conforme se va avanzando en la normalización, las relaciones tienen un formato más estricto (más fuerte) y, por lo tanto, son menos vulnerables a las anomalías de actualización, pero para evitar las anomalías de actualización, es recomendable llegar al menos a la tercera forma normal. VENTAJAS DE NORMALIZAR RELACIONES
• Evitar problemas con los datos al realizar operaciones
de: inserción (insert into), actualización (update) y eliminación de registros (delete). • Mejorar la independencia de los datos. • Se cuenta con la confiabilidad de los datos que esten almacenados en el sistema de base de datos. FORMAS NORMALES • I FN: Un conjunto de relaciones se encuentra en 1FN si ninguna de ellas tiene grupos repetitivos. • 2 FN: Una relación está en segunda forma normal si, y sólo si, está en 1FN y, además, cada atributo que no es clave primaria es completamente dependiente de la clave primaria. La 2FN se aplica a las relaciones que tienen claves primarias compuestas por dos o más atributos. Si una relación está en 1FN y su clave primaria es simple (tiene un solo atributo), entonces también está en 2FN. Las relaciones que no están en 2FN pueden sufrir anomalías cuando se realizan actualizaciones. FORMAS NORMALES • 3 FN: Una relación esta en 3FN si cumple la 2FN y si no existe interdependencia entre los campos que no son llaves. • FNBC: (A,B,C) donde A y B determinan a C Ejemplo: 1 FN Planteamiento del problema: En una empresa de compra de albunes musicales se utilizan comprobantes de la orden de compra, fecha de la orden, nombre e identificación y dirección de los proveedores, código, titulo, cantidad y valor unitario del album. Solución: 1. Especifique los atributos en forma no normalizada. 2. Separe el grupo repetitivo en la 1 FN. FORMA NO NORMALIZADA (UFN)
ORD_NO: Número de orden de Compra
ORD_DATE: Fecha de la orden de compra PROV_NO: Número del proveedor PROV_NAME: Nombre del proveedor PROV_DIR: Dirección del proveedor PROV_NIT: Nit o identificación del proveedor CODIGO: Código del CD o album TITULO: Título del CD o album CANTIDAD: Cantidad de CDs a pedir VR_UNIT: Valor unitario del CD o Album NOTA: Las formas no normalizadas deben tener al menos una llave, para este caso es el ORD_NO. PRIMERA FORMA NORMAL SEPARAR EL GRUPO REPETITIVO
En la forma no normalizada se puede observar que los atributos
que están después de PROV_NIT son repetitivos, esto quiere decir, que para una misma orden aparecen varias veces, dado que en una misma orden se pueden encargar varias categorías , o varios títulos de la misma categoría. Los grupos repetitivos deben ser separados de la forma UFN y ser escritos como un grupo independiente con su respectiva llave. Este grupo debe relacionarse con el grupo no repetitivo enlazando la llave del grupo no repetitivo junto con la llave del repetitivo. Así: PRIMERA FORMA NORMAL GRUPO NO REPETITIVO GRUPO REPETITIVO ORD_NO CODIGO ORD_DATE TITULO PROV_NO CANT PROV_NAME VR_UNIT PROV_DIR PROV_NIT El grupo repetitivo tiene a CODIGO como llave. Sin embargo esta llave no es única , dado que se puede repetir en otros números de orden. Necesita ser combinada con la llave del primer grupo. Al combinar los campos ORD_NO y CODIGO para el segundo grupo, se puede deducir que esta combinación puede actuar como llave única, ya que no puede haber una misma orden que tenga dos códigos iguales; por tanto, después de aplicar la 1FN tenemos: PRIMERA FORMA NORMAL GRUPO 1 GRUPO 2 ORD_NO ORD_NO LLAVE ORD_DATE CODIGO PROV_NO TITULO PROV_NAME CANT PROV_DIR VR_UNIT PROV_NIT SEGUNDA FORMA NORMAL
GRUPO 1 GRUPO 2 GRUPO 3
ORD_NO ORD_NO CODIGO ORD_DATE CODIGO TITULO PROV_NO CANT VR_UNIT PROV_NAME PROV_DIR PROV_NIT Los grupos de datos de llaves combinadas son analizados, llaves que tengan más de un campo para lograr unicidad TERCERA FORMA NORMAL