Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFORMÁTICA 2010
BASE DE DATO
Aunque las bases de datos pueden contener muchos tipos de datos, algunos
de ellos se encuentran protegidos por las leyes de varios países. Por ejemplo,
en España los datos personales se encuentran protegidos por la Ley Orgánica
de Protección de Datos de Carácter Personal (LOPD).
2. Terminología Básica:
2.1Carácter:
2.2 Dato:
2.3 Campo:
Campo genérico: Aquel campo que posee un dato único para una
repetición de entidad. Puede servir para la búsqueda de una
entidad en específico.
Alfanuméricos: Contiene cifras y letras. Presentan una longitud
limitada (225 caracteres).
Numéricos: Existen de varios tipos principalmente como enteros y
reales.
Booleanos: Admite dos valores, "Verdadero" y "Falso" (True-
False).
2.5 Registro:
Para la informática, existen distintos tipos de registros, pero en todos los casos
hay una referencia al concepto de almacenar datos o información sobre el
estado, procesos o uso de la computadora.
En primer lugar, un registro del sistema viene a ser una base de datos que
tiene el fin de almacenar configuración, opciones y comandos propios del
sistema operativo. En general, estos registros se utilizan en los sistemas
Windows de Microsoft. Un registro de sistema puede contener información y
configuraciones del hardware y software en uso, preferencias del usuario,
asociaciones de archivos y ficheros, usos de sistema, cambios y
modificaciones, etcétera. Estos registros son conservados dentro del sistema
con denominaciones como “User.dat” o “System.dat” y pueden ser recuperados
por el usuario para su transporte a otro sistema.
2.6 Archivo:
3.3 Entidad
Hay dos tipos de entidades: fuertes y débiles. Una entidad débil es una entidad
cuya existencia depende de la existencia de otra entidad. Una entidad fuerte es
una entidad que no es débil.
Una relación recursiva es una relación donde la misma entidad participa más
de una vez en la relación con distintos papeles. El nombre de estos papeles es
importante para determinar la función de cada participación.
3.5 Atributo
Por último, los atributos pueden ser derivados. Un atributo derivado es aquel
que representa un valor que se puede obtener a partir del valor de uno o varios
atributos, que no necesariamente deben pertenecer a la misma entidad o
relación.
3.6 Identificador
3.7Jerarquía de generalización
En primer lugar hay que definir los principales objetos que interesan al usuario.
Estos objetos serán las entidades. Una forma de identificar las entidades es
examinar las especificaciones de requisitos de usuario. En estas
especificaciones se buscan los nombres o los sintagmas nominales que se
CIENCIAS ECONOMICAS 8vo. CICLO 11
22 DE OCTUBRE DE
INFORMÁTICA 2010
Otra forma de identificar las entidades es buscar aquellos objetos que existen
por sí mismos. Por ejemplo, empleado es una entidad porque los empleados
existen, sepamos o no sus nombres, direcciones y teléfonos. Siempre que sea
posible, el usuario debe colaborar en la identificación de las entidades.
A veces, es difícil identificar las entidades por la forma en que aparecen en las
especificaciones de requisitos. Los usuarios, a veces, hablan utilizando
ejemplos o analogías. En lugar de hablar de empleados en general, hablan de
personas concretas, o bien, hablan de los puestos que ocupan esas personas.
Para liarlo aún más, los usuarios usan, muchas veces, sinónimos y
homónimos. Dos palabras son sinónimos cuando tienen el mismo significado.
Los homónimos ocurren cuando la misma palabra puede tener distintos
significados dependiendo del contexto.
Conforme se van identificando las entidades, se les dan nombres que tengan
un significado y que sean obvias para el usuario. Los nombres de las entidades
y sus descripciones se anotan en el diccionario de datos. Cuando sea posible,
se debe anotar también el número aproximado de ocurrencias de cada entidad.
Si una entidad se conoce por varios nombres, éstos se deben anotar en el
diccionario de datos como alias o sinónimos.
Una vez definidas las entidades, se deben definir las relaciones existentes
entre ellas. Del mismo modo que para identificar las entidades se buscaban
nombres en las especificaciones de requisitos, para identificar las relaciones se
suelen buscar las expresiones verbales (por ejemplo: oficina tiene empleados,
empleado gestiona inmueble, cliente visita inmueble). Si las especificaciones
de requisitos reflejan estas relaciones es porque son importantes para la
empresa y, por lo tanto, se deben reflejar en el esquema conceptual.
Pero sólo interesan las relaciones que son necesarias. En el ejemplo anterior,
se han identificado las relaciones empleado gestiona inmueble y cliente visita
inmueble. Se podría pensar en incluir una relación entre empleado y cliente:
empleado atiende a cliente, pero observando las especificaciones de requisitos
no parece que haya interés en modelar tal relación.
La mayoría de las relaciones son binarias (entre dos entidades), pero no hay
que olvidar que también puede haber relaciones en las que participen más de
dos entidades, así como relaciones recursivas.
Es muy importante repasar las especificaciones para comprobar que todas las
relaciones, explícitas o implícitas, se han encontrado. Si se tienen pocas
entidades, se puede comprobar por parejas si hay alguna relación entre ellas.
De todos modos, las relaciones que no se identifican ahora se suelen encontrar
cuando se valida el esquema con las transacciones que debe soportar.
Una vez identificadas todas las relaciones, hay que determinar la cardinalidad
mínima y máxima con la que participa cada entidad en cada una de ellas. De
este modo, el esquema representa de un modo más explícito la semántica de
las relaciones. La cardinalidad es un tipo de restricción que se utiliza para
comprobar y mantener la calidad de los datos. Estas restricciones son
aserciones sobre las entidades que se pueden aplicar cuando se actualiza la
base de datos para determinar si las actualizaciones violan o no las reglas
establecidas sobre la semántica de los datos.
Hay que tener mucho cuidado cuando parece que un mismo atributo se debe
asociar a varias entidades. Esto puede ser por una de las siguientes causas:
En este paso hay que observar las entidades que se han identificado hasta el
momento. Hay que ver si es necesario reflejar las diferencias entre distintas
ocurrencias de una entidad, con lo que surgirán nuevas subentidades de esta
entidad genérica; o bien, si hay entidades que tienen características en común
y que realmente son subentidades de una nueva entidad genérica.
Antes de dar por finalizada la fase del diseño conceptual, se debe revisar el
esquema conceptual local con el usuario. Este esquema está formado por el
Los campos comunes entre tablas son los que hacen posibles las bases de
datos relacionales. Si mantiene los nombres y direcciones de los clientes en la
misma tabla, tendrá que introducir la dirección de un cliente cada vez que el
cliente realice un pedido. O cuando cambie una dirección, deberá actualizar
todos los pedidos realizados por ese cliente.
La mayoría de los campos en una base de datos son del tipo numérico o
alfanumérico, aunque habrá veces en que se necesiten todos los tipos de
campos. A continuación se enlistan los tipos de campos más utilizados:
Longitud fija de un campo. Cada campo debe tener el tamaño necesario para
poder albergar la información del dato que lo caracteriza. Ahora bien, la
longitud de la información puede ser variable. Por ejemplo, tenemos la lista de
nombres:
4. Normalización
4.1 Dependencia
Los individuos tienen muchos atributos que pueden ser de interés a diferentes
personas en diferentes momentos. Nuestro problema actual es con una sola
aplicación o conjunto de aplicaciones: solemne son de interés algunos de los
atributos.
Total uno-uno-sinónimo
Completa - subtupla
Transitiva - múltiple.
S ----> T; S ----> V
Sin embargo, sería deseable encontrar una relación más restrictiva o definida.
4.6 Reducción
Para que una relación esté en primera forma normal (1 FN), debe ser
solamente una relación propia, una matríz m por n, donde:
Cada tupla tiene una clave que la identifica en forma unívoca, pero dicha
clave no significa orden.
Para que una relación sea normalizada en pasos adicionales, debe encontrarse
en la primera forma normal. Colocar los datos en la primera forma normal está
a cargo del diseñador de la aplicación. Estos datos se encuentran disponibles
de alguna manera inicialmente. Si la aplicación existe en forma manual, o ha
sido anteriormente computarizada pero no todavía como relación, el diseñador
reorganiza los datos de modo de conformar una matríz 1FN.
Dado que una tupla debe tener un número fijo de componentes, necesitamos
una tupla en primera forma normal para cada parte de cada pedido
Por lo tanto cada tupla consiste en una parte de datos que son variables y
datos del pedido que se duplican para cada parte ordenada.
Una vez que los datos han sido puestos en primera forma normal, resulta
conveniente descomponer la relación en un número de relaciones más
pequeñas, cada una en forma normal superior, de modo de optimizar el
almacenamiento y usar sus funciones.
4.14 Proyección
4.15 Grafos
4.16 Efectos
4.18 Efecto
Existe una tupla P en la sub-relación de pieza o parte, P, para cada parte y una
tupla. W, en la sub relación W, para cada depósito y estos últimos
probablemente no serán muchos. Consideremos la facilidad de efectuar
cambios en un depósito en particular. Si un atributo de uno de los depósitos
varía entraremos en W para efectuar el cambio solamente en una tupla.
4.20 Descripción
Q ---> A ----> B
4.23 Descomposición
Dependencias multivaluadas
posible una reducción adicional en este caso, y esto es lo que se lleva a cabo
mediante la cuarta forma normal.
El resultado son nuevas sub-relaciones que han sido utilizadas para ahorra
espacio y permitir una más fácil actualización.
6. Manejo de Datos:
Algoritmos de datos
Una base de datos relacional es una base de datos que cumple con el modelo
relacional, el cual es el modelo más utilizado en la actualidad para implementar
bases de datos ya planificadas. Permiten establecer interconexiones
(relaciones) entre los datos (que están guardados en tablas), y a través de
dichas conexiones relacionar los datos de ambas tablas, de ahí proviene su
nombre: "Modelo Relacional". Tras ser postuladas sus bases en 1970 por
Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos.
7.1 Características
7.2 Elementos
Restricciones:
Las restricciones no son parte formal del modelo relacional, pero son incluidas
porque juegan el rol de organizar mejor los datos. Las restricciones son muy
discutidas junto con los conceptos relacionales.
Dominios:
Clave única:
Cada tabla puede tener uno o más campos cuyos valores identifican de forma
única cada registro de dicha tabla, es decir, no pueden existir dos o más
Pueden existir varias claves únicas en una determinada tabla, y a cada una de
éstas suele llamársele candidata a clave primaria.
Clave primaria:
Una clave primaria es una clave única elegida entre todas las candidatas que
define univocamente a todos los demas atributos de la tabla, para especificar
los datos que serán relacionados con las demás tablas. La forma de hacer esto
es por medio de claves foráneas.
Sólo puede existir una clave primaria por tabla y ningún campo de dicha clave
puede contener valores NULL.
Clave foránea:
Una clave foránea es una referencia a una clave en otra tabla. Las claves
foráneas no necesitan ser claves únicas en la tabla donde están y sí a donde
están referenciadas. Por ejemplo, el código de departamento puede ser una
clave foránea en la tabla de empleados, obviamente se permite que haya
varios empleados en un mismo departamento, pero existirá sólo un
departamento.
Clave índice:
Las claves índices surgen con la necesidad de tener un acceso más rápido a
los datos. Los índices pueden ser creados con cualquier combinación de
campos de una tabla. Las consultas que filtran registros por medio de estos
campos, pueden encontrar los registros de forma no secuencial usando la clave
índice.
Procedimientos almacenados:
Estructura
Manipulación de la información
Al contrario del modelo relacional, el estándar SQL requiere que las columnas
tengan un orden definido, lo cual es fácil de implementar en una computadora,
ya que la memoria es lineal.
Es de notar, sin embargo, que en SQL el orden de las columnas y los registros
devueltos en cierto conjunto de resultado nunca está garantizado, a no ser que
explícitamente sea especificado por el usuario.
Ventajas
Desventajas