Está en la página 1de 9

RESUMEN GDD

MODELOS DE DATOS: es un sistema formal y abstracto que permite describir los datos de acuerdo con reglas y
convenios predefinidos.
Es formal pues los objetos del sistema se manipulan siguiendo reglas perfectamente definidas y utilizando
exclusivamente los operadores definidos en el sistema, independientemente de lo que estos objetos y operadores
puedan significar.
Un modelo se obtiene a través de un proceso de abstracción, mediante el cual en el modelo sólo se representan
aquellos aspectos del mundo real que son relevantes para el objetivo del sistema o dominio en estudio.

Según Cadd, un modelo de datos es una combinación de 3 componentes:


 Una colección de estructuras de datos.
 Una colección de operadores o reglas de inferencia.
 Una colección de reglas generales de integridad.

CATEGORÍAS:
Modelos de datos de alto nivel o conceptuales: muy cercanos al modo como la mayoría de los usuarios percibe los
datos.
 Basados en objetos:
- Modelo de dominio.
- Modelo Entidad – Relación.
 Basados en registros:
- Jerárquico.
- Redes.
- Relacional.
Modelos de datos de bajo nivel o físicos: proporcionan conceptos que describen los detalles sobre cómo se almacenan
los datos en la computadora.

ENTIDAD: tipo de información que tiene interés para la empresa. Es “algo” del mundo real con existencia
independiente, tener existencia física o existencia conceptual.
Puede ser denominada como tipo de entidad, conjunto de entidades (aludiendo a que cada instancia que conforma el
objeto es una entidad) o simplemente entidad (entendiendo que se conforma con todas las instancias del objeto).

RELACIÓN: correspondencia, conexión o vínculo entre dos o más entidades.

ATRIBUTOS: caracterizan a la entidad o relación.


TIPOS DE ATRIBUTOS:
 SIMPLE O ATÓMICO: admite valores que no pueden subdividirse.
 COMPUESTO: cuando puede dividirse en atributos más pequeños.
 MONOVALUADO: si sólo admite un valor para una instancia de una entidad particular.
 MULTIVALUADO: pueden existir atributos que asumen varios valores para una misma entidad. Un atributo
multivaluado puede tener un límite inferior y superior en el número de valores para una entidad individual.
 ALMACENADOS: son aquellos que deben guardarse con la entidad pues no pueden calcularse ni de otros
atributos de la misma entidad u otras, ni de su relación con otras entidades.
 DERIVADOS: se calculan en función de otro atributo.
 VALORES NULOS: en algunos casos un atributo podría no tener valor para una instancia de una entidad.
 IDENTIFICADORES O CLAVES: cada entidad debe tener un único identificador que permite individualizar cada
una de sus instancias. Pueden ser un conjunto de atributos a lo que se denomina clave compuesta. Todos los
atributos que conforman una clave deben ser monovaluados y siempre deben tener valor.
RESTRICCIONES ESTRUCTURALES: se explicitan para las relaciones que vinculan las entidades.
VÍNCULO BINARIO: relaciona dos entidades.
GRADO DEL VÍNCULO: número de entidades que participan en una relación.
RAZÓN DE CARDINALIDAD: número de instancias del vínculo en los que puede participar cada entidad de una relación o
vínculo. Ej: N a M.
RESTRICCIÓN DE PARTICIPACIÓN: especifica si la existencia de una entidad depende de que esté relacionada con otra
entidad.
En los casos de vínculos 1 a N un atributo del mismo sólo se podrá trasladar a la entidad del lado N del vínculo.

ENTIDADES FUERTES: tienen un atributo o conjunto de atributos que identifican a sus instancias unívocamene, es decir
con un identificador o clave.

ENTIDADES DÉBILES: entidad que no posee un identificador o clave asociado y su identificación depende del vínculo con
otra entidad. Hay dependencia de identificación. Al vínculo con la entidad de la que depende su identificación se lo
denomina vínculo identificador.
Una entidad débil puede depender de otra entidad débil o de una entidad de nivel superior.
Una entidad débil siempre tiene una restricción de participación total o dependencia de existencia con otra entidad a
través de su vínculo identificador. Sin embargo, no toda dependencia de existencia da lugar a un tipo de entidad débil.
El identificador o clave de una entidad débil se conformará con el identificador de la entidad de la que depende más el
conjunto de atributos que conformen su discriminante.

RELACIONES TERNARIAS: las cardinalidades mínimas de una relación ternaria las consideramos siempre 1. Las
cardinalidades de un vínculo ternario podrán ser todas 1..N, solo podrá existir una con cardinalidad 1..1. No
necesariamente las entidades que participan de este tipo de relaciones deben ser entidades fuertes.

NOTACIÓN DE UN MODELO E-R


HERENCIA DE LOS ATRIBUTOS:
Una instancia de la entidad no puede existir solo en la subclase, también debe existir en la superclase.
Todas las instancias de la entidad que es miembro de una subclase heredan todos los atributos de su superclase pero
además pueden tener atributos propios.

RAZONES PARA USAR SUPERCLASES/SUBCLASES:


 Existen atributos que se aplican a algunas de las instancias de la superclase, no a todas.
 Existen relaciones con algunas subclases, no con todas.

GENERALIZACIÓN: implica un refinamiento conceptual ascendente durante el diseño del esquema conceptual.
Comenzemos encontrando subclases y a partir del proceso de generalización encontramos las clases o superclases.

ESPECIALIZACIÓN: es el proceso de definir subclases con las instancias de una entidad. Implica un refinamiento
conceptual descendente. Comenzamos con una entidad y definimos subclases de la misma mediante especializaciones
sucesivas.
Las subclases que forman una especialización se definen a partir de alguna característica distintiva de las instancias de la
superclase.
ESPECIALIZACIÓN DEFINIDA POR ATRIBUTO: si todas las subclases de una especialización definen la condición de
pertenencia en términos del mismo atributo de la superclase, se dice que la especialización es una especialización
definida por atributo y el atributo se denomina atributo de definición de la especialización.
ESPECIALIZACIÓN DEFINIDA POR EL USUARIO: cuando no tenemos condición que determine la pertenencia a una
subclase, es el usuario el que define individualmente la pertenencia a cada entidad y no una condición que pueda ser
evaluada de forma automática.

RESTRICCIÓN DE DISYUNCIÓN: “D” significa que una instancia de la entidad solo puede ser miembro de una de las
subclases de la especialización. Ej: un artículo es bebida o ingrediente, no puede ser las dos cosas a la vez.

RESTRICCIÓN DE SOLAPAMIENTO: “S” la misma instancia de la entidad puede ser miembro de más de una subclase de
especialización.
Podríamos representar una especialización definida por atributo con restricción de disyunción mediante un atributo
monovaluado.

RESTRICCIÓN DE COMPLETITUD:
TOTAL: toda instancia de la entidad de la superclase debe ser miembro de alguna subclase de la especialización, se
indica con doble línea.
PARCIAL: una entidad no pertenece a ninguna de las subclases.

REGLAS DE INSERCIÓN Y ELIMINACIÓN QUE SE APLICAN A LA ESPECIALIZACIÓN:


 Eliminar una instancia de una entidad de una superclase implica eliminar todas las instancias de las subclases a
las que pertenece.
 Insertar una instancia de una entidad en una superclase de una especialización total implica insertar la misma
en por lo menos una de las subclases de la especialización.
 Insertar una instancia de una entidad en una superclase de una especialización parcial no implica
necesariamente insertar la misma en alguna de las subclases de la especialización.

Una subclase puede tener más subclases definidas a partir de ella.


JERARQUÍA: cuando la subclase participa de una única relación clase-subclase se dice que forma una jerarquía. En las
jerarquías las subclases tienen una herencia única, es decir heredan los atributos de la clase con la que están
relacionadas.
RETÍCULA: si una subclase participa en más de una relación clase-subclase se dice que forma una retícula y a la subclase
se la denomina subclase compartida. En las retículas las subclases tienen herencia múltiple.
Regla: si un atributo que se origina en la superclase se hereda más de una vez a través de diferentes caminos en la
retícula debería incluirse solo una vez en la subclase compartida.

CATEGORÍA: es una clase resultante del proceso por el cual varias clases de naturaleza distinta se agrupan (unen) para
formar una nueva clase. Una categoría proviene de dos o más superclases. Una categoría es un subconjunto de la unión
de sus superclases. Puede ser parcial o total. Las superclases de una categoría pueden tener diferentes atributos clave.

AGREGACIÓN: es una abstracción a través de la cual las relaciones se tratan como entidades de nivel más alto. Es útil
cuando el objeto agregado de más alto nivel se debe relacionar con otro objeto posteriormente.
 Una agregación hace referencia al vínculo N a M de las entidades que agrega.
 La agregación puede estar haciendo referencia a un vínculo de cualquier grado y las entidades participantes del
mismo pueden ser de cualquier tipo.
 La agregación puede luego vincularse con otras entidades y participar de vínculos de cualquier grado. También
puede ser parte de una jerarquía.

MODELO RELACIONAL:
ESTRUCTURA DE DATOS: tablas o relaciones. El nombre de modelo relacionar deriva del uso de relaciones (o tablas)
que constan de un conjunto de t-uplas (filas de la tabla o registros) constituidas por un conjunto de atributos (columnas
de la tabla) cuyos valores pertenecen a un dominio.
A la cantidad de atributos que constituyen una relación se lo denomina grado de la relación.
REGLAS DE INTEGRIDAD O RESTRICCIONES:
 INTEGRIDAD DE ENTIDAD: establece que la clave primaria o el identificador de una tabla debe tener un valor
único para el conjunto de filas de la tabla.
 INTEGRIDAD REFERENCIAL: esta restricción surge de definir una clave foránea en una tabla que estará vinculada
con la clave o identificador de otra tabla, a la que denominaremos clave primaria. La integridad referencial
asegura la integridad entre la clave foránea de una tabla y la clave primaria de la tabla con la que se relaciona.
 INTEGRIDAD DE DOMINIO: dominio de valores de los atributos que constituyen la relación o tabla, los valores
que pueden admitirse en el atributo, en su implementación en bases de datos será el tipo de datos de cada
columna.

DEPENDENCIAS FUNCIONALES:
r=R (T, DF)
R: nombre de la relación.
T: conjunto de atributos que componen la relación: T={A1, A2, A3,…,An}
DF= conjunto de restricciones o dependencias funcionales que se deducen de las reglas del dominio que estamos
trabajando: DF={DF1, DF2, …, DFm}
Cada Dfi se expresa como X->Y, donde X e Y son subconjuntos del conjunto de atributos T de R y se denominan
descriptores. X se denomina determinante e Y se denomina determinado.
Se dice que Y es funcionalmente dependiente de X (X->Y) o que X determina funcionalmente a Y si todo valor legal
posible de X tiene asociado precisamente un único valor de Y.
Las dependencias funcionales están ligados a la búsqueda de claves y a los conceptos de normalización.

CLAVE CANDIDATA: es el atributo o mínimo conjunto de atributos que identifican unívocamente una instancia de una
relación o tabla. Ninguno de estos atributos podrá admitir valores nulos, tampoco los atributos agregan información a la
clave y por eso el conjunto es mínimo. De todas las claves candidatas se seleccionará una para utilizarla como CLAVE
PRIMARIA.
AXIOMAS DE ARMSTRONG:
REFLEXIVIDAD:
A partir de cualquier atributo o conjunto de atributos siempre puede deducirse él mismo.
AUMENTATIVIDAD:
Se puede aumentar trivialmente el determinante de una dependencia.
TRANSITIVIDAD: o enlace de dependencias funcionales.
PROYECTIVIDAD O DESCOMPOSICIÓN:
ADITIVIDAD O UNIÓN:
PSEUDO-TRANSITIVIDAD:

Estos axiomas pueden ser utilizados para:


 Determinar si una dependencia funcional X->Y no indicada inicialmente en un conjunto DF es válida.
 Determinar si dos representaciones del mismo problema son equivalentes.
 Determinar las claves candidatas y primarias.

NORMALIZACIÓN: es el proceso por el cual una relación se descompone en dos o más relaciones que satisfacen ciertas
condiciones denominadas formas normales.
Se normaliza para:
 Evitar la redundancia de datos.
 Evitar problemas de actualización de los datos en tablas.
 Proteger la integridad de datos.
 Mejorar la independencia de los datos, permitiendo la modificación del diseño lógico de los datos afectando
muy poco los programas de aplicación.

PRIMERA FORMA NORMAL (1NF): si una relación cumple la propiedad de que sus atributos o columnas contienen solo
valores atómicos (no son multivaluados o compuestos) y pertenecen a un mismo dominio de valores y además no
existen grupos repetitivos.

SEGUNDA FORMA NORMAL (2NF): si una relación además de estar en 1NF cualquiera de sus atributos no-claves
dependen completamente de cada una de las claves candidatas de la relación.

TERCERA FORMA NORMAL (3NF): si una relación además de estar en 2NF cualquiera de sus atributos no-claves no
depende transitivamente de las claves candidatas de la relación.

FORMA NORMAL BOYCE-CODD (BCNF): si una relación además de estar en la 3NF cada dependencia funcional no
trivial, tiene una clave candidata como determinante.

REGLAS DE TRANSFORMACIÓN:
REGLA DEL TIPO ENTIDAD: cada tipo de entidad se convierte en una tabla:
 ENTIDADES FUERTES: se transforman en una tabla que incluye todos los atributos de la entidad. La clave
primaria estará formada por el/los atributos que identifiquen unívocamente a cada instancia de la entidad.
 ENTIDADES DÉBILES: se transforman en una tabla que incluye todos los atributos de la entidad más la clave del
vínculo identificador (el/los atributos de la entidad fuerte de la que depende). La clave primaria de la tabla
estará formada por la clave de la entidad de la que depende más el atributo discriminante de la entidad débil. La
clave de la entidad de la que depende debe marcarse como clave foránea.
REGLA DEL VÍNCULO BINARIO 1 a M: cada vínculo 1 a M se convierte en una clave foránea en la tabla que corresponda
al tipo de entidad hija (lado con cardinalidad M). Si la cardinalidad mínima del lado de la entidad madre es 1 la clave
foránea no puede aceptar valores nulos.
REGLA DEL VÍNCULO BINARIO M a N: cada vínculo binario M a N se convierte en una tabla separada conformada por los
atributos que conforman la clave a cada lado del vínculo más los atributos descriptivos del vínculo.
Los atributos que conforman la clave a cada lado del vínculo conformarán las claves foráneas a cada una de las tablas
derivadas de las entidades a cada lado del vínculo.
Para seleccionar la clave primaria:
Si el vínculo no posee atributos descriptivos: la clave primaria de la tabla es una combinación formada por las claves
primarias de los tipos de entidad que participan en la relación.
Si el vínculo posee atributos descriptivos: la elección de la clave primaria depende de las dependencias funcionales que
surjen de la narrativa ya que alguno de los atributos de la relación deben o no formar parte de la clave.
REGLA DEL VÍNCULO RECURSIVO: pueden aplicarse las reglas para vínculos 1 a N o N a M.
VÍNCULOS DE GRADO MAYOR A 2: la regla coincide con la de vínculos N a M con atributos y deben analizarse según la
narrativa.
CONVERSIÓN DE JERARQUÍAS DE GENERALIZACIÓN: en cada caso particular se deberán analizar las ventajas y
desventajas de cada una y seleccionar aquella más conveniente al caso particular. Se pueden tomar los siguientes
enfoques.
CONVERSIÓN DE JERARQUÍA COMPLETA: cada entidad de la jerarquía se transforma en una tabla siguiendo la regla 1,
con los atributos indicados en cada superclase/subclase. Además se indican en las subclases la clave primaria de la
superclase que se convierte en clave foránea a la tabla de la jerarquía de la que dependen.
Todas las tablas creadas tienen la misma clave primaria, la de la superclase.
Ventajas:
 Mejor uso de espacio de almacenamiento.
 Modelización exacta del dominio.
Desventajas:
 Para acceder a toda la información de una subclase debe accederse a las tablas de todas sus superclases.
 Requiere coordinación entre las claves primarias de las superclases y subclases.
 Cada nuevo subtipo requiere al menos una nueva tabla y las consultas asociadas a la misma.
 Complejo modelado de las jerarquías solapadas.
 Complejo mecanismo de identificación del tipo de la subclase.
CONVERSIÓN A SUPERCLASE: la conversión resulta en una única tabla que surge de la transformación de la superclase a
la que se le agregan los atributos de todas las subclases, pudiendo se los mismos nulos. En este caso la clave primaria de
la tabla es la clave primaria de la superclase.
Ventajas:
 El acceso a cualquier subclase sólo requiere acceso a una tabla.
 No requiere coordinación entre las claves primarias de las superclases y subclases.
 Fácil modelado de jerarquías solapadas.
 Rara vez requiere modificaciones en el modelo de datos para agregar una nueva subclase.
Desventajas:
 Desperdicio de espacio para aquellos atributos de las subclases que no son comunes.
 Complejo mecanismo de identificación de tipo de la subclase.
CONVERSIÓN A SUBCLASE: consiste en que solo las subclases de menor nivel se implementan. Las mismas heredan
todos los atributos de sus superclases que no se implementan.
Ventajas:
 Fácil mecanismo de identificación de la subclase.
 Uso de espacio de almacenamiento eficiente cuando los atributos comunes de las subclases son pocos.
 Eficiente acceso a todos los datos de una subclase particular.
Desventajas:
 Uso de espacio de almacenamiento ineficiente cuando los atributos comunes de las subclases son muchos.
 Requiere mecanismos complejos de coordinacion de claves primarias para jerarquías solapadas.
 Cada nuevo subtipo requiere una nueva tabla y las consultas asociadas a la misma.
 Complejo modelado de las jerarquías solapadas.
 Mecanismo de identificación de tipo de la subclase más complejo.
RELACIÓN: conjunto de t-uplas para los que se especifican atributos. Se denomina tamien TABLA.

T-UPLA: cada una de las instancias de la relación denominada también como registro o fila.

ATRIBUTOS: carácterísticas que nos interesan de una relación, denominadas también columnas.

ÁLGEBRA RELACIONAL: es un conjunto de operaciones definidas para manipular datos en el modelo relacional.
Permitirán especificar las peticiones de recuperación o actualización de datos. Es un lenguaje procedimental.
Las operaciones se aplicarán sobre una o más relaciones del modelo y darán como resultado una nueva relación. Estas
nuevas relaciones podrán formar parte de nuevas operaciones.
Existen varias clasificaciones de las operacions mencinadas.
 Diferencia los operadores que aplican nociones de la teoría de conjunto y las que no. La teoría matemática de
conjuntos es posible de aplicar es posble de aplicar ya que las relaciones se definen como un conjunto de tuplas.
Entre estas operaciones que aplican la teoría de conjunto se incluyen: unión, intersección, diferencia y producto
cartesiano. EL resto de las operaciones, definidas específicamente para manipular el modelo, se encuentran:
selección, proyección y reunión.
 Otra clasificación se realiza en función del número de relaciones que participan en la operación. Serán unitarias
o binarias.
 Otra clasificación las categoriza en operaciones fundamentales o básicas y operaciones adicionales o derivadas
ya que pueden expresarse en función de las anteriores.

OPERACIONES UNITARIAS: trabajan con una sola relación.

SELECCIÓN: devuelve una nueva relación con las tuplas que cumplen con el predicado de la selección.

El predicado puede realizar comparación de atributos con valores fijos o puede realizar comparación entre atributos. En
este último caso siempre se compararán los valores contenidos en los atributos de la misma tupla o fila.
Operadores aritméticos: =, =, >, >=, <, <=.
Operadores lógicos: Y (and, ), O (or, v), negado (not, ¬)

PROYECCIÓN: devuelve una nueva relación con los atributos (columnas) indicados en la proyección. Elimina las tuplas
repetidas.

OPERACIONES BINARIAS: trabajan con dos relaciones. Entre las operaciones fundamentales binarias encontraremos las
que aplican la teoría de conjuntos.
PRODUCTO CARTESIANO: aplicado a dos relaciones de grado N y M respectivamente, devuelve una nueva relación de
grado N + M resultante de combinar todas las tuplas de la primer relación con las tuplas de la segunda relación (todas
las columnas de la primera y la segunda).La cantidad de tuplas de la relación resultante será el producto de la cantidad
de tuplas de ambas relaciones combinadas. R1 x R2.
UNIÓN: devuelve una nueva relación con las tuplas de la primer relación y las tuplas de la segunda relación. Se eliminan,
como en todo conjunto, las tuplas repetidas. R1 U R2.
R1 y R2 deben ser uniones compatibles (tienen el mismo grado (misma cantidad de atributos) y el dominio de los
valores del i-ésimo atributo de la relación R1 es el mismo que el del i-ésimo atributo de la relación R2).
DIFERENCIA: devuelve una nueva relación donde las tuplas están en la primera relación y no en la segunda. Las
relaciones también deben ser unión compatibles (deben tener el mismo grado y sus atributos el mismo dominio de
valores). R1 – R2.
INTERSECCIÓN: devuelve una nueva relación con las tuplas que se encuentran en ambas relaciones. Se dice una
operación adicional o derivada ya que puede resolverse en función de las operaciones básicas vistas anteriormente.
También las relaciones involucradas deben ser unión compatibles. R1 ∩ R2 = R1 – (R1 – R2).
NATURAL JOIN (REUNIÓN NATURAL O PRODUCTO NATURAL): operación derivada de realizar el producto cartesiano
entre las relaciones involucradas, seguido de las operaciones selección y proyección. Estas últimas operaciones se
realizan sobre los atributos del mismo dominio que se igualan para la selección y luego se quita el atributo repetido en
la proyección. Los atributos deben tener los mismos nombres en ambas relaciones. R1 |X| R2.
JOIN (REUNIÓN THETA- THETA JOIN): operación que permite realizar una combinación entre las relaciones que deriva
de realizar el producto cartesiano entre las mismas seguido de la operación selección cuya condición (Ꝋ) se debe
respetar en la combinación.
DIVISIÓN: supongamos una relación R1 con un conjunto de atributos Z y una relación R2 con un conjunto de atributos X.
R1 ÷ R2. Si X C Z y dará como resultado una nueva relación con un conjunto de atributos Y donde Y = Z – X, es decir Z = X
U Y, o lo que es lo mismo, Y serán los atributos de R1 que no son atributos de R2. Además, para que una tupla aparezca
en la nueva relación los valores de la tupla deben estar en R1 en combinación con todas las tuplas de R2.
La división es una operación derivada ya que puede expresarse como una secuencia de operaciones de proyección,
producto cartesiano y diferencia, como sigue:

RENOMBRAR: se indica el nombre de la relación y los atributos que deseemos renombrar de la siguiente forma:
R1(atributoR11, atributoR12, …, atributoR1N) <- ∏(R)
Atributo1, atributo2,…, atributoN.
INSERCIÓN: el agregado de tuplas a una relación se consigue mediante el operador unión. R1 <- R1 U R2. Ambas
relaciones deberán ser uniones compatibles y se eliminarán las filas repetidas que hubiera.

ELIMINACIÓN: el borrado de tuplas de una relación se consigue mediante el operador diferencia. R1 <- R1 – R2. Ambas
relaciones deberán ser uniones compatibles y las del modelo relacional. En este último caso no se podrán eliminar filas
que estén relacionadas con otras tablas a través de las claves foráneas.

ACTUALIZACIÓN: A <- atributo = calculo (A).

CÁLCULO RELACIONAL DE TUPLAS: lo que interesa es encontrar tuplas para las que se cumple cierto predicado. (lógica
de primer orden).
PREDICADO para determinar una selección: {t / P(t)} tuplas tal que cumplan un predicado determinado (P es el
predicado o fórmula).
EXISTE para determinar una proyección: nos permite definir variables límites, es decir aquellas que queremos que
aparezcan como resultado de la expresión.

GESTIÓN DE DATOS: administrar los datos de los sistemas de información y de negocio de una organización mediante
técnicas y herramientas modernas.
DEBEN DAR RESPUESTA A :
 Disparidad de arquitecturas de soporte.
 Conectividad.
 Disponibilidad.
 Concurrencia.
 Gran cantidad de transacciones por segundo.
 Escalabilidad.
 Habilidades de consulta.
 Calidad de la información.
 Privacidad.
 Integridad.
 Seguridad.

También podría gustarte