Está en la página 1de 22

Bases de Datos I - Clase # 13

4ta, 5ta forma normal y teorema de


Rissannen

Profesores:
Ing. Larry Catarine
Ing. Kevin Vargas
Normalizaciòn

Proceso que tiene como


base la dependencia
funcional, la misma se
utiliza para poder
diseñar correctamente
el modelo relacional de
una base de datos.
¿Cuál es el problema principal que
soluciona al normalización?
Anomalías de diseño

La redundancia de datos es la causante de las anomalías de diseño, las cuales se presentan


en la consulta, inserción, modificación y eliminación de datos, originando:

 Anomalía de consulta en grupos repetitivos

 Anomalía de inserción

 Anomalía de modificación

 Anomalía de eliminación

Las anomalías de cierta forma son las que nos van a ayudar a detectar si nuestro diseño de
base de datos es correcto para el modelo negocios que nos estamos planteando.
Anomalía de consulta en
grupos repetitivos
Esta ocurre cuando algunos atributos del mismo tipo están manejados como columnas de forma finita

Por ejemplo, en el siguiente esquema tenemos la relación de dormitorios asignados a alumnos,


junto a los cursos que tiene cada alumno.

Entonces vemos que para consultar los cursos de un alumno tendremos que consultar todas las
columnas según el alumno que más cursos tenga y lidiar con los datos vacíos
Anomalía de inserción

Esta ocurre cuando algunos atributos no pueden ser insertados a la relación sin que existan otros
atributos entre los cuales no deberían depender entre sí.

Por ejemplo, en el siguiente esquema tenemos la relación de dormitorios asignados a alumnos, y


si quisiéramos agregar un dormitorio, tendríamos que lo asignarlo a alguien.

Entonces vemos que no podemos insertar algunos datos si no existen otros datos que deberían ser
independientes.
Anomalía de modificación

Al modificar datos cuando existe redundancia, no se modifica el dato duplicado en todas las
instancias

Por ejemplo, en la siguiente ilustración vemos que si modificamos un apellido esta no se modifica
en todas las instancias.

De esta manera terminaremos con dos alumnos diferentes.


Anomalía de eliminación
En estas anomalías podemos tener que al eliminar algunos atributos, también se pierdan otros
atributos que no queríamos eliminar

Por ejemplo, en la siguiente relación se tiene un registro de las materias que cursan los
estudiantes y si por ejemplo un alumno quiere abandonar una materia, también se eliminaría
toda la información relacionada tanto del curso como del profesor

Para evitar estas anomalías debemos aplicar el proceso de normalización.


• Dejar todos los campos con valores atómicos
• Las tablas no deben tener valores nulos
• Al tener campos atómicos, tendremos campos con redundancia que deben
1 FN pasarse a tablas nuevas y relacionarlos con la PK

• Identificar las columnas que no son llave y que no dependen de la llave primaria
de la tabla y se pueden sacar como tablas adicionales si tienen ids visibles
• Eliminar dichas columnas de la tabla base
2 FN • Crear una nueva tabla con dichas columnas y la columna de la PK que la relaciona

• Revisar nuevamente para determinar las columnas que son dependientes de otra
columna no llave (transitividad) y / o que generarán redundancia a futuro
• Eliminar esas columnas de la tabla base
3 FN • Crear otra tabla con esas columnas y la columna no llave
Tabla de ejemplo
Primera forma normal – 1FN

31678990

31234578

31234578
Primera forma normal – 1FN
Segunda forma normal – 2FN
Tercera forma normal – 3FN
• Se elimina la redundancia cuando existen
dependencias multivaluadas, es decir se eliminan
4 FN las relaciones muchos a muchos

• Ocurre en situaciones en las cuales una restricción


compleja del mundo real, limita las combinaciones
5 FN válidas de los valores de atributos en la tabla 4NF
Cuarta forma normal – 4FN
Documento Interés Hobbie Modificación por regla de negocio
El equipo funcional de RRHH solicita guardar los
1234 Programación Futbol intereses y los hobbies de los colaboradores de la
empresa sobre una lista finita predeterminada, pero
1234 Redes Futbol se hace generando una anomalía de inserción

Programación Características de la anomalía:


1234 Programar

✔ Hay al menos 3 atributos y 2 poseen valores


1234 Modelado Paint Ball
múltiples que dependen del tercer valor

✔ Del punto anterior tiene atributos multivaluados


8896 Penal Cocinar

Cocinar
✔ No tiene dependencias transitivas
8896 Penal

8896 Deportivo Tenis

4345 Construcción Cocinar

4345 Civil Tenis


Cuarta forma normal – 4FN
Documento Interés Hobbie Documento Interés Documento Hobbie

1234 Programación Futbol Programación Futbol


1234 1234

1234 Redes Futbol


1234 Redes 1234 Programar

1234 Programación Programar 1234 Modelado 1234 Paintball

1234 Modelado PaintBall 8896 Penal 8896 Cocinar

8896 Penal Cocinar 8896 Deportivo 8896 Tenis

8896 Penal Cocinar


4345 Construcción 4345 Cocinar

8896 Deportivo Tenis 4345 Civil 4345 Tenis

4345 Construcción Cocinar


PD: Dependiendo de la Q de Hobbies e intereses el DBA debe decidir si deja los
4345 Civil Tenis valores semánticos o genera un ID por C/U y crea las tablas de asociación mediante
tablas, generando 4 en total
Quinta forma normal – 5FN
Documento Interés Hobbie Restricción por regla de negocio:

1234 Programación Futbol


Supongamos que recursos humanos necesitaba registrar y
estudiar los hobbies de los colaboradores para analizar los
1234 Redes Futbol
hobbies que realmente tienen que ver con sus intereses
Programación
para desarrollarlos.
1234 Programar

1234 Modelado Paintball

8896 Penal Cocinar

8896 Penal Cocinar

8896 Deportivo Tenis

4345 Construcción Cocinar

4345 Civil Tenis


Quinta forma normal – 5FN
Restricción por regla de negocio:
Documento Interés Documento Hobbie
Supongamos que recursos humanos necesita registrar y
1234 Programación 1234 Futbol estudiar los hobbies de los colaboradores que realmente
tienen que ver con sus especialidades para desarrollarlas.
1234 Redes 1234 Programar

1234 Modelado 1234 Paintball


Interés Hobbie

8896 Penal 8896 Cocinar


Programación Programar

8896 Deportivo 8896 Tenis


Deportivo Tenis

4345 Construcción 4345 Cocinar

4345 Civil 4345 Tenis

PD: Dependiendo si se crearon las tablas con Ids en la 4ta forma normal, esta tabla
de restricción se almacenaría solo con Ids y se tendría que documentar la razón de su
creación
Teorema de Rissanen
RISSANEN propuso en 1976 un método para saber si una determinada descomposición es correcta (que conserva la
información y las nuevas dependencias funcionales) mediante proyecciones independientes

Características:

✔ Las DF se aprecian semánticamente


✔ Todas las tablas se relacionan por FK
Generalidades

 Como vimos, la normalización de bases de datos es muy importante para corregir defectos
de diseño, así evitar la redundancia de datos y garantizar la integridad de estos.

 La normalización va a depender directamente del modelo de negocios que plantean los


equipos funcionales.

 Debemos analizar cuidadosamente cuando debemos permitir la redundancia para simplificar


el diseño y obtener mejor rendimiento de la base de datos. Ejemplo: Tablas intermedias que
permitan optimizar las consultas.
¡¡¡Gracias por acompañarnos!!!

También podría gustarte