Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Definiciones
Datos: Representación del mundo real o una porción del mismo analizado y que puede ser grabado. Cada
elemento es de 1 entidad o individuo. Ejemplo: de un banco, un dato es una cuenta, un cliente, una compañía. De
un inventario, es una pieza que se registra su stock.
Son porciones de información que tiene importancia para alguna entidad. Residen en la BD y son utilizados por las
aplicaciones.
Base de datos:
Es un conjunto de datos entre los que existe una relación y que están Ventajas de una Base de Datos
almacenados con criterios que son independientes de los programas • Elimina Información Redundante
que las utilizan. La filosofía tiende a buscar almacenar grandes • Control centralizado
cantidades de información de forma no redundante, que permita las • Compartición de la Información
consultas. La colección de datos lógicamente coherentes con algun • Elimina Inconsistencia de Datos
tipo de significado inherente. Se diseña, se construye y se rellena con • Permite la Independencia de
datos para un objetivo determinado para un grupo de usuarios y con Datos
aplicaciones que permitan su manipulación.
Archivo o Fichero: se crea para cada aplicación, por lo que los datos se recogen varias veces y se encuentran en
distintos archivos. La redundancia malgasta recursos y origina divergencia en los resultados.
Conjunto de Archivos: un archivo es una colección de registros correspondientes a una entidad. No está
normalizado (presenta redundancia).
Arquitectura de un Sistema de BD
Es la forma de visualizar una BD. Existen transformaciones de los datos entre cada par de niveles. Existen 3
niveles:
Forma en que se organiza la BD a nivel de Sistema Operativo, es decir, haciendo uso de la
Nivel interno o
gestión del almacenamiento físico, se estudia método d acceso (secuencial, directo). No se
estructura física
estudia cuestiones como cilindro usado. Existe una sola vista que representa la BD total.
Representación abstracta de la BD. Es la interfaz entre el nivel interno y el nivel externo. Nivel
Nivel conceptual
intermedio entre usuario y máquina. Se define la vista de los usuarios, hace de interfase.
o estructura
Incluye la estructura a realizar con el esquema de la lógica de campos y registros. Se
lógica global
encuentran las entidades, los atributos, las relaciones, las operaciones y las restricciones.
Nivel externo o Es la visión de la BD que posee el usuario final. Es el más cercano al usuario, comprende
estructura lenguaje de programación y/o herramientas de desarrollo. Es el que usan los usuarios para
lógica de realizar las consultas. El archivo que el usuario puede manejar.
usuario
BD Física
Almacena los datos físicamente. Contiene el conjunto de datos operativos de una empresa.
BD lógica
Contiene las visualizaciones lógicas que tienen los usuarios finales de las BD físicas. Pueden haber muchas BD
lógicas de una física.
Relación de la Base de Datos, el DBMS y el Sistema Informático
El DBMS se asienta sobre un Sistema Operativo, mientras la BD puede ubicarse dentro o fuera del Sistema
Informático que tiene dicho Sistema Operativo.
Antes Después
Ventajas Ventajas
Desventajas Desventajas
Integridad Referencial
Las entidades dentro de la BD están relacionadas y esto hace que no sean independientes.
Es una norma que indica la posibilidad de agregar o eliminar instancias (registros) en entidades que ya se
encuentran relacionadas a otras entidades. Esto requiere realizar controles, se aplican reglas de consistencia a
través de los campos que tienen en común estas tablas.
Reglas de consistencia:
• Si se borran registros de una tabla padre que tiene hijos (subordinados) se deben primero eliminar los
registros de las tablas hijos (subordinados) y luego eliminar los registros en las tabla padre.
• Si se inserta un dato en una tabla hijo, se debe verificar que exista en la tabla padre el dato
correspondiente.
BASE DE DATOS RESUMEN
• Si se modifica la clave primaria de una tabla padre que tiene hijos, se debe modificar primero en la tabla
padre.
Reglas de integridad:
• Integridad de la entidad: Una clave primaria no puede aceptar valor nulo. Esta regla es obligatoria.
• Integridad referencial: todas las referencias a otras tablas deben ser integras y válidas. Si sobre una clave
externa hay un valor no nulo, entonces debe haber un registro en la relación con la tabla de esa clave que
aporte referencia con ese valor de clave primaria. Esta regla no es obligatoria.
MODELOS DE BD
Modelo Jerárquico: modelo más simple. Establece una estructura de árbol invertido. La información que tiene
relaciones muy estrechas entre sí se almacena en forma conjunta como una unidad lógica. Pero 2 unidades lógicas
pueden contener información relacionada. Entonces, en esta estructura se considera una unidad como padre y otra
como unidad hija. La unidad padre puede tener varias unidades hijas, y cada unidad hija solo puede tener 1 padre.
Relaciones 1:N (de arriba hacia abajo).
La extracción de una unidad de información que se encuentra en las hojas, requiere navegar un camino muy largo
a través de las relaciones.
Ventaja Desventaja
Relación simple Alta Redundancia de datos
Para grandes volúmenes de información Requiere conocimiento profundo de todas las relaciones y la
estructura.
Rápido acceso a las unidades de información. Combinar unidades de información de ramas muy separadas
requiere mucho tiempo y esfuerzo.
Modelo de Red: ahora un nodo hija puede tener varios padres. Versión menos restrictiva del modelo jerárquico.
La estructura permite que cualquier unidad se encuentre relacionada con cualquier otro conjunto de unidades
mediante relaciones fijas. Las unidades no forman ninguna estructura específica, se comportan como una red de
conexiones. No existe una estructura predeterminada. Puede haber una unidad que no tenga ninguna relación con
otras unidades.
Relaciones: N a N. Porque cada unidad debe acceder en un sentido 1 a N, y a su vez la otra puede hacer 1 a N
para acceder a la anterior.
Ventaja Desventaja
Representa bien la redundancia Requiere más programación
No tiene estructura fija. Es difícil la administración
Requiere un conocimiento profundo de la estructura y las relaciones.
BASE DE DATOS RESUMEN
Modelo Relacional: la estructura almacena la información en unidades lógicas llamadas tablas. Una tabla
muestra una serie de filas y columnas. Cada columna representa un tipo de información (atributo) y cada fila
representa el conjunto de información relativo a una entidad (registro). No hay relaciones fijas, no existe el criterio
padre/hijo, no hay un camino jerarquizado. Las relaciones entre tablas se crean de forma temporal: pueden ser
como en la tabla siguiente, en función de la consulta deseada (Ejemplo, cuando se hace un select de 2 tablas).
1:1 La interrelación solo puede aparecer una ocurrencia del tipo de entidad por cada ocurrencia del otro tipo de
entidad.
1:N Para un tipo de entidad puede haber una cantidad indefinida de ocurrencia del otro tipo de entidad que
está dentro de la relación.
N:N Para un tipo de entidad puede haber una cantidad indefinida de ocurrencias del otro tipo de entidad y
viceversa.
Ventaja Desventaja
Cualquier columna de cualquier tabla puede ser Mayor tiempo para crear las relaciones temporales.
relacionada con cualquier otra columna de otra tabla.
La tecnología actual permite este tipo de relaciones
temporales.
Modelo Orientado a Objetos: se estructura por objeto, clases y relaciones. Está compuesto por el modelo de
objetos, el funcional y el dinámico.
Bases de datos documentales: permiten la indexación a texto completo, y en líneas generales realizar
búsquedas más potentes.
Base de datos deductivas: permite hacer deducciones a través de inferencias. Se basa principalmente en reglas
y hechos que son almacenados en la base de datos. También las bases de datos deductivas son llamadas base de
datos lógicas, a raíz de que se basan en lógica matemática.
Bases de Datos distribuidas: no están almacenadas totalmente en un solo lugar físico, (esta segmentada) y se
comunican por medio de enlaces de comunicaciones a través de una red de computadoras distribuidas
geográficamente. Surgen debido a la existencia física de organismos descentralizados. Esto les da la capacidad de
unir las bases de datos de cada localidad y acceder así a distintas universidades, sucursales de tiendas, etcetera
Modelo Entidad Relacion Extendida (MERE)
En el modelo EER es representado por medio de tres conceptos:
1 - Entidades, representan los objetos a modelar
2 – Atributos, representan las propiedades de las entidades
3 - Relaciones, representan las asociaciones entre entidades.
Ventaja Desventaja
Relaciones complejas.
Las situaciones del mundo real frecuentemente tiene relaciones más complejas que relaciones binarias 1: 1, l:n o
m:n. Por ejemplo podemos tener relaciones entre entidades del mismo tipo o relaciones entre más de tipos de
entidades.
Relaciones recursivas.
Las relaciones recursivas son relaciones entre diferentes instancias del mismo tipo de entidad.
Ejemplos: relación recursiva de 1: 1.
Una instancia del tipo de entidad PERSONA puede estar relacionado con otro miembro a través de la relación
CASADA-CON.
Ejemplo: relación recursiva de l:n.
Una instancia del tipo de entidad EMPLEADO puede supervisar a otras instancias. Si asumimos que un empleado
puede tener un supervisor entonces tenemos que la relación SUPERVISA es una relación recursiva de l:n.
Ejemplo: relación recursiva de m:n.
BASE DE DATOS RESUMEN
Una instancia del tipo de entidad PARTE puede estar compuesta de otras partes, mientras que una dada parte
puede ser una componente de muchas otras partes. Esta situación podría representarse por la relación recursiva
de m:n COMPRENDE.
Para que se considere Relacional se debe permitir la selección de filas de una tabla en una consulta, listar
columnas de una tabla por referencia a su nombre y cualquier tipo de unión entre tablas.
Relaciones Binarias
Son las deseadas en el modelo relacional. Aquí se toman como supertipos y subtipos.
Supertipo: es una entidad que posee atributos que la definen y que permiten integrar a las otras entidades
denominadas Subtipos. Cumpel con la condición de preservar los atributos del supertip.
Subtipo: Un tipo de entidad El es un subtipo de un tipo de entidad E2 si toda instancia de El es también una
instancia de E2. Un subtipo puede pasar a ser supertipo si se establece un cambio de jerarquías. Los subtipos
pueden también tener subtipos, formando así una jerarquía.
Un tipo de entidad E es una generalización de los tipos de entidad El, E2, ...,En si cada ocurrencia de E es también
una ocurrencia y solo una de las entidades El, E2, ... 1 En.
Como ejemplo de subtipos consideremos una base de datos de una pequeña compañía la cual representa a la
cabeza de cada departamento como un gerente, el cual es una categoría especial de empleado. También, hay
muchas otras categorías del tipo de entidad EMPLEADO tales como Secretaria, Técnico e Ingeniero. Cada uno de
estos tipos de entidades comparten algunas propiedades en virtud de que estas pueden ser consideradas como
diferentes categorías del tipo de entidad EMPLEADO.
Estos tipos de entidades son subtipos del tipo
de entidad EMPLEADO, la cual se dice que es
un Supertipo. Observe que una instancia de
un subtipo no puede existir en la base de
datos sin que también sea miembro del
supertipo. Esto es, una instancia de un subtipo
representa una entidad del mundo real como
alguna instancia del supertipo.
Generalización y especialización
Desde un punto de vista alternativo, el tipo de entidad EMPLEADO puede ser considerado como una generalización
de los tipos de entidad SECRETARIA, INGENIERO y TECNICO si toda instancia EMPLEADO en la base de datos, es
también una instancia de uno de estos subtipos. En este caso las entidades tipo SECRETARIA, INGENIERO y
TECNICO forman una especialización del tipo de entidad EMPLEADO donde cada especialización se distingue por el
valor de sus atributos. En este caso el atributo de distinción podría ser CARGO.
Relaciones Ternarias.
BASE DE DATOS RESUMEN
Estas involucran tres tipos de entidades. Como ejemplo consideremos la base de
datos de la Fig. 40 la cual mantiene información sobre compañías, los productos que
fabrican y los países a los cuales exportan estos productos. La funcionalidad de esta
relación es m:n:q. Esto refleja los siguientes hechos acerca de la relación:
Para un dado par (compañía, producto) hay muchos países para los cuales el
producto es vendido.
Para un dado par (país, producto) hay muchas compañías que exportan este
producto a este país.
Para un dado par (compañía, país) hay muchos productos exportados por esa compañía a ese país.
La funcionalidad de una relación ternaria también podría ser l: m: n, 1: l:n ó 1: 1: 1.
Las relaciones no puedan representarse en forma precisa a
través de relaciones binarías. Por ejemplo, si una compañía
fabrica muchos productos y exporta todos estos productos a
diferentes países, entonces las dos relaciones binarias
independientes EXPORTA y FABRICA de la Fig. 41.
reemplazan a la relación ternaria.
ventaja desventaja
Mejora manejo de alto volumen de información Alto costo de actualización de HW y SW.
Independencia del tratamiento de la información Un mal diseño de la BD puede ser un costo alto
Seguridad en el acceso Requiere capacitación de usuarios
Objetivos
• Abstracción de la información: no muestra al usuario detalles del almacenamiento físico.
• Independencia de los datos
• Minimizar la Redundancia
• Lograr la consistencia de los datos: que la información repetida se actualice de forma coherente y que la
información cumpla con las políticas de la empresa (que sea precisa).
• Seguridad de los datos
• Lograr la integridad referencial:
• Respaldo y recuperación
• Control de concurrencia
• Minimizar tiempo de respuesta (Eficiencia)
Funciones
• Definición de datos: recibe en forma fuente (alto nivel) y las convierte a forma objeto (bajo nivel).
Requiere un compilador DDL.
• Manipulación de datos: requiere el compilador DML.
• Optimización y ejecución: determina una forma eficiente de implementar una solicitud.
• Seguridad e integridad de los datos: analiza peticiones de usuario y rechaza las peticiones que intentan
violar las normas de seguridad e integridad definidas por el DBA.
• Recuperación y concurrencia de datos: relacionado con la gestión de backups y con el acceso concurrente
a la BD.
• Diccionario de datos: es una BD de definiciones de objetos del sistema (reglas de seguridad e integridad,
niveles, transformaciones, +índices, usuarios por ejemplo). SI se hace un cambio en el sistema, se
consulta el diccionario para ver cómo serían afectados los usuarios.
BASE DE DATOS RESUMEN
• Rendimiento: busca la eficiencia.
VISTAS: tiene la misma estructura de la BD pero no los datos. El usuario cree que trabaja con los datos. Se
representa igual que una tabla. Se puede hacer INSERT, UPDATE, etcétera. Es una estructura lógica.
PL/SQL: extensión de SQL, agrega construcción de lenguajes procedimentales.
Data Mining
La minería de datos consiste en la extracción no trivial de información que reside de manera implícita en los datos.
Predicen futuras tendencias y comportamiento, permitiendo en los negocios tomar decisiones proactivas y
conducidas por un conocimiento acabado de la información. La técnica usada es el MODEALADO, es un acto de
construir un modelo en una situación donde se conoce la respuesta y luego se aplica dicho modelo en otras
situaciones de la cual se desconoce la respuesta.
Fases de Data Mining:
Filtrado de Datos
Selección de Variables
Extracción de Conocimientos
Interpretación y Evaluación
Data Warehouse
Es una colección de datos orientado a:
• Temas: la información se clasifica en base a temas que son de interés para la empresa.
• Integración: la información encontrada en el interior del DW está integrada.
• De tiempo variante: la información del DW es requerida en cualquier momento.
• No volátil: la información es útil solo cuando es estable.
Cursor
Es un área de trabajo de memoria, que contiene los datos de las filas de la tabla consultada por la sentencia
SELECT. Para procesar individualmente muchas filas se usa 1 cursor.
Creación de un 1 Cursor
1) Definir la Consulta asociada al Cursor.
2) Definir los parámetros que usa.
3) Establecer la consulta que almacena.
Usar Cursor
1) Abrir Cursor para inicializar
2) Leer fila pasando al Cursor las variables definidas.
3) Repetir fila a fila hasta el final.
4) Cerrar Cursor.
Estructura
DECLARE Ejemplo
…. CREATE OR REPLACE PROCEDURE nombre IS
BEGIN [Variables que usa]
BASE DE DATOS RESUMEN
…. BEGIN
EXCEPTION …
…. END;
END;
No se permite crear DROP, CREATE, ALTER
Ejemplo Ejemplo
Mivariables mitabla columna % type Variable exception;
BEGIN
Ejemplo …
SELECT nombre_columna INTO nombre_variable EXCEPTION
WHEN variable THEN …
END;
Notación
Nombre_variable: comienza con v
Nombre_constante: comienza con c
Nombre_tipo: comienza con t
Nombre_cursor: comienza con c