Investigacion Base de Datos

22 DE OCTUBRE DE
INFORMÁTICA 2010
BASE DE DATO
1. ¿Qué es una Base de datos?
Una base de datos o banco de datos (en ocasiones abreviada B.D.D.) es un

conjunto de datos pertenecientes a un mismo contexto y almacenados
sistemáticamente para su posterior uso. En este sentido, una biblioteca puede
considerarse una base de datos compuesta en su mayoría por documentos y
textos impresos en papel e indexados para su consulta. En la actualidad, y
debido al desarrollo tecnológico de campos como la informática y la electrónica,
la mayoría de las bases de datos están en formato digital (electrónico), que
ofrece un amplio rango de soluciones al problema de almacenar datos.
Existen programas denominados sistemas gestores de bases de datos,

abreviados SGBD, que permiten almacenar y posteriormente acceder a los
datos de forma rápida y estructurada. Las propiedades de estos SGBD, así
como su utilización y administración, se estudian dentro del ámbito de la
informática.
Las aplicaciones más usuales son para la gestión de empresas e instituciones

públicas. También son ampliamente utilizadas en entornos científicos con el
objeto de almacenar la información experimental.
Aunque las bases de datos pueden contener muchos tipos de datos, algunos
de ellos se encuentran protegidos por las leyes de varios países. Por ejemplo,
en España los datos personales se encuentran protegidos por la Ley Orgánica
de Protección de Datos de Carácter Personal (LOPD).
2. Terminología Básica:
2.1Carácter:
Es un elemento tomado de un conjunto de símbolos. Un ejemplo de un

conjunto de símbolos es {0,1,2,3,4,5,6,7,8,9,A, B, C….Y ,z, ¡,-,+,*} en el cual se
incluyen dígitos, los caracteres del alfabeto y algunos caracteres especiales.
Un compilador de lenguaje reconoce un conjunto particular de caracteres.
CIENCIAS ECONOMICAS 8vo. CICLO 1
22 DE OCTUBRE DE
INFORMÁTICA 2010
2.2 Dato:
Es una representación simbólica (numérica, alfabética, algorítmica etc.), un

atributo o una característica de una entidad. El dato no tiene valor semántico
(sentido) en sí mismo, pero si recibe un tratamiento (procesamiento) apropiado,
se puede utilizar en la realización de cálculos o toma de decisiones. Es de
empleo muy común en el ámbito informático y, en general, prácticamente en
cualquier disciplina científica.
En programación, un dato es la expresión general que describe las

características de las entidades sobre las cuales opera un algoritmo.
En Estructura de datos, es la parte mínima de la información.
Un dato por sí mismo no constituye información, es el procesamiento de los

datos lo que nos proporciona información.
2.3 Campo:
En informática, un campo es un espacio de almacenamiento para un dato en

particular. En las bases de datos, un campo es la mínima unidad de
información a la que se puede acceder; un campo o un conjunto de ellos
forman un registro, donde pueden existir campos en blanco, siendo éste un
error del sistema. En las hojas de cálculo los campos son llamados celdas. La
mayoría de los campos tienen atributos asociados a ellos. Por ejemplo, algunos
campos son numéricos mientras otros almacenan texto, también varía el
tamaño de estos. Adicionalmente, cada campo tiene un nombre.

22 DE OCTUBRE DE
INFORMÁTICA 2010
2.4 Tipos de Campo
Un campo puede ser:
 Campo genérico: Aquel campo que posee un dato único para una
repetición de entidad. Puede servir para la búsqueda de una
entidad en específico.
 Alfanuméricos: Contiene cifras y letras. Presentan una longitud
limitada (225 caracteres).
 Numéricos: Existen de varios tipos principalmente como enteros y
reales.
 Booleanos: Admite dos valores, "Verdadero" y "Falso" (True-
False).
2.5 Registro:
Un registro informático es un tipo o conjunto de datos almacenados en un

sistema.
Para la informática, existen distintos tipos de registros, pero en todos los casos
hay una referencia al concepto de almacenar datos o información sobre el
estado, procesos o uso de la computadora.
En primer lugar, un registro del sistema viene a ser una base de datos que
tiene el fin de almacenar configuración, opciones y comandos propios del
sistema operativo. En general, estos registros se utilizan en los sistemas
Windows de Microsoft. Un registro de sistema puede contener información y
configuraciones del hardware y software en uso, preferencias del usuario,
asociaciones de archivos y ficheros, usos de sistema, cambios y
modificaciones, etcétera. Estos registros son conservados dentro del sistema
con denominaciones como “User.dat” o “System.dat” y pueden ser recuperados
por el usuario para su transporte a otro sistema.

22 DE OCTUBRE DE
INFORMÁTICA 2010
2.6 Archivo:
Un archivo o fichero informático es un conjunto de bits almacenado en un

dispositivo periférico.
Un archivo es identificado por un nombre y la descripción de la carpeta o

directorio que lo contiene. Los archivos informáticos se llaman así porque son
los equivalentes digitales de los archivos en tarjetas, papel o microfichas del
entorno de oficina tradicional. Los archivos informáticos facilitan una manera de
organizar los recursos usados para almacenar permanentemente datos en un
sistema informático.
En lo que concierne al sistema operativo, un archivo es, en la mayoría de los

casos, simplemente un flujo unidimensional de bits , que es tratado por el
sistema operativo como una única unidad lógica. Un archivo de datos
informático normalmente tiene un tamaño, que generalmente se expresa en
bytes; en todos los sistemas operativos modernos, el tamaño puede ser
cualquier número entero no negativo de bytes hasta un máximo dependiente
del sistema. Depende del software que se ejecuta en la computadora el
interpretar esta estructura básica como por ejemplo un programa, un texto o
una imagen, basándose en su nombre y contenido. Los tipos especiales de
archivos, como los nodos de dispositivo que representan simbólicamente
partes del hardware, no consisten en un flujo de bits y no tienen tamaño de
archivo.
3. Conceptos para el diseño de base de datos
El diseño de una base de datos es un proceso complejo que abarca decisiones

a muy distintos niveles. La complejidad se controla mejor si se descompone el
problema en subproblemas y se resuelve cada uno de estos subproblemas
independientemente, utilizando técnicas específicas. Así, el diseño de una base
de datos se descompone en diseño conceptual, diseño lógico y diseño físico.

22 DE OCTUBRE DE
INFORMÁTICA 2010
El diseño conceptual parte de las especificaciones de requisitos de usuario y su

resultado es el esquema conceptual de la base de datos. Un esquema
conceptual es una descripción de alto nivel de la estructura de la base de
datos, independientemente del SGBD que se vaya a utilizar para manipularla.
Un modelo conceptual es un lenguaje que se utiliza para describir esquemas
conceptuales. El objetivo del diseño conceptual es describir el contenido de
información de la base de datos y no las estructuras de almacenamiento que se
necesitarán para manejar esta información.
El diseño lógico parte del esquema conceptual y da como resultado un

esquema lógico. Un esquema lógico es una descripción de la estructura de la
base de datos en términos de las estructuras de datos que puede procesar un
tipo de SGBD. Un modelo lógico es un lenguaje usado para especificar
esquemas lógicos (modelo relacional, modelo de red, etc.). El diseño lógico
depende del tipo de SGBD que se vaya a utilizar, no depende del producto
concreto.
El diseño físico parte del esquema lógico y da como resultado un esquema

físico. Un esquema físico es una descripción de la implementación de una base
de datos en memoria secundaria: las estructuras de almacenamiento y los
métodos utilizados para tener un acceso eficiente a los datos. Por ello, el
diseño físico depende del SGBD concreto y el esquema físico se expresa
mediante su lenguaje de definición de datos.
3.1 Modelos de datos
Un modelo de datos es una serie de conceptos que puede utilizarse para

describir un conjunto de datos y las operaciones para manipularlos. Hay dos
tipos de modelos de datos: los modelos conceptuales y los modelos lógicos.
Los modelos conceptuales se utilizan para representar la realidad a un alto
nivel de abstracción. Mediante los modelos conceptuales se puede construir
una descripción de la realidad fácil de entender. En los modelos lógicos, las

22 DE OCTUBRE DE
INFORMÁTICA 2010
descripciones de los datos tienen una correspondencia sencilla con la

estructura física de la base de datos.
En el diseño de bases de datos se usan primero los modelos conceptuales

para lograr una descripción de alto nivel de la realidad, y luego se transforma el
esquema conceptual en un esquema lógico. El motivo de realizar estas dos
etapas es la dificultad de abstraer la estructura de una base de datos que
presente cierta complejidad. Un esquema es un conjunto de representaciones
lingüísticas o gráficas que describen la estructura de los datos de interés.
Los modelos conceptuales deben ser buenas herramientas para representar la

realidad, por lo que deben poseer las siguientes cualidades:
 Expresividad: deben tener suficientes conceptos para expresar

perfectamente la realidad.
 Simplicidad: deben ser simples para que los esquemas sean fáciles de
entender.
 Minimalidad: cada concepto debe tener un significado distinto.
 Formalidad: todos los conceptos deben tener una interpretación única,
precisa y bien definida.
En general, un modelo no es capaz de expresar todas las propiedades de una

realidad determinada, por lo que hay que añadir aserciones que complementen
el esquema.
3.2 El modelo entidad-relación
El modelo entidad-relación es el modelo conceptual más utilizado para el

diseño conceptual de bases de datos. Fue introducido por Peter Chen en 1976.
El modelo entidad-relación está formado por un conjunto de conceptos que
permiten describir la realidad mediante un conjunto de representaciones
gráficas y lingüísticas.
Originalmente, el modelo entidad-relación sólo incluía los conceptos de entidad,

relación y atributo. Más tarde, se añadieron otros conceptos, como los atributos

22 DE OCTUBRE DE
INFORMÁTICA 2010
compuestos y las jerarquías de generalización, en lo que se ha denominado

modelo entidad-relación extendido.
Figura 6.1: Conceptos del modelo entidad-relación extendido.
3.3 Entidad
Cualquier tipo de objeto o concepto sobre el que se recoge información: cosa,

persona, concepto abstracto o suceso. Por ejemplo: coches, casas, empleados,
clientes, empresas, oficios, diseños de productos, conciertos, excursiones, etc.
Las entidades se representan gráficamente mediante rectángulos y su nombre
aparece en el interior. Un nombre de entidad sólo puede aparecer una vez en
el esquema conceptual.
Hay dos tipos de entidades: fuertes y débiles. Una entidad débil es una entidad
cuya existencia depende de la existencia de otra entidad. Una entidad fuerte es
una entidad que no es débil.
3.4 Relación (interrelación)

22 DE OCTUBRE DE
INFORMÁTICA 2010
Es una correspondencia o asociación entre dos o más entidades. Cada relación

tiene un nombre que describe su función. Las relaciones se representan
gráficamente mediante rombos y su nombre aparece en el interior.
Las entidades que están involucradas en una determinada relación se

denominan entidades participantes. El número de participantes en una relación
es lo que se denomina grado de la relación. Por lo tanto, una relación en la que
participan dos entidades es una relación binaria; si son tres las entidades
participantes, la relación es ternaria; etc.
Una relación recursiva es una relación donde la misma entidad participa más
de una vez en la relación con distintos papeles. El nombre de estos papeles es
importante para determinar la función de cada participación.
La cardinalidad con la que una entidad participa en una relación especifica el

número mínimo y el número máximo de correspondencias en las que puede
tomar parte cada ocurrencia de dicha entidad. La participación de una entidad
en una relación es obligatoria (total) si la existencia de cada una de sus
ocurrencias requiere la existencia de, al menos, una ocurrencia de la otra
entidad participante. Si no, la participación es opcional (parcial). Las reglas que
definen la cardinalidad de las relaciones son las reglas de negocio.
A veces, surgen problemas cuando se está diseñado un esquema conceptual.

Estos problemas, denominados trampas, suelen producirse a causa de una
mala interpretación en el significado de alguna relación, por lo que es
importante comprobar que el esquema conceptual carece de dichas trampas.
En general, para encontrar las trampas, hay que asegurarse de que se
entiende completamente el significado de cada relación. Si no se entienden las
relaciones, se puede crear un esquema que no represente fielmente la
realidad.
Una de las trampas que pueden encontrarse ocurre cuando el esquema

representa una relación entre entidades, pero el camino entre algunas de sus
ocurrencias es ambiguo. El modo de resolverla es reestructurando el esquema
para representar la asociación entre las entidades correctamente.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Otra de las trampas sucede cuando un esquema sugiere la existencia de una

relación entre entidades, pero el camino entre una y otra no existe para algunas
de sus ocurrencias. En este caso, se produce una pérdida de información que
se puede subsanar introduciendo la relación que sugería el esquema y que no
estaba representada.
3.5 Atributo
Es una característica de interés o un hecho sobre una entidad o sobre una

relación. Los atributos representan las propiedades básicas de las entidades y
de las relaciones. Toda la información extensiva es portada por los atributos.
Gráficamente, se representan mediante bolitas que cuelgan de las entidades o
relaciones a las que pertenecen.
Cada atributo tiene un conjunto de valores asociados denominado dominio. El

dominio define todos los valores posibles que puede tomar un atributo. Puede
haber varios atributos definidos sobre un mismo dominio.
Los atributos pueden ser simples o compuestos. Un atributo simple es un

atributo que tiene un solo componente, que no se puede dividir en partes más
pequeñas que tengan un significado propio. Un atributo compuesto es un
atributo con varios componentes, cada uno con un significado por sí mismo. Un
grupo de atributos se representa mediante un atributo compuesto cuando
tienen afinidad en cuanto a su significado, o en cuanto a su uso. Un atributo
compuesto se representa gráficamente mediante un óvalo.
Los atributos también pueden clasificarse en monovalentes o polivalentes. Un

atributo monovalente es aquel que tiene un solo valor para cada ocurrencia de
la entidad o relación a la que pertenece. Un atributo polivalente es aquel que
tiene varios valores para cada ocurrencia de la entidad o relación a la que
pertenece. A estos atributos también se les denomina multivaluados, y pueden
tener un número máximo y un número mínimo de valores. La cardinalidad de
un atributo indica el número mínimo y el número máximo de valores que puede
tomar para cada ocurrencia de la entidad o relación a la que pertenece.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Por último, los atributos pueden ser derivados. Un atributo derivado es aquel
que representa un valor que se puede obtener a partir del valor de uno o varios
atributos, que no necesariamente deben pertenecer a la misma entidad o
relación.
3.6 Identificador
Un identificador de una entidad es un atributo o conjunto de atributos que

determina de modo único cada ocurrencia de esa entidad. Un identificador de
una entidad debe cumplir dos condiciones:
1. No pueden existir dos ocurrencias de la entidad con el mismo valor del

identificador.
2. Si se omite cualquier atributo del identificador, la condición anterior deja
de cumplirse.
Toda entidad tiene al menos un identificador y puede tener varios

identificadores alternativos. Las relaciones no tienen identificadores.
3.7Jerarquía de generalización
Una entidad E es una generalización de un grupo de entidades E , E , ... E ,

si cada ocurrencia de cada una de esas entidades es también una ocurrencia
de E. Todas las propiedades de la entidad genérica E son heredadas por las
subentidades.
Cada jerarquía es total o parcial, y exclusiva o superpuesta. Una jerarquía es

total si cada ocurrencia de la entidad genérica corresponde al menos con una
ocurrencia de alguna subentidad. Es parcial si existe alguna ocurrencia de la
entidad genérica que no corresponde con ninguna ocurrencia de ninguna
subentidad. Una jerarquía es exclusiva si cada ocurrencia de la entidad
genérica corresponde, como mucho, con una ocurrencia de una sola de las
subentidades. Es superpuesta si existe alguna ocurrencia de la entidad
genérica que corresponde a ocurrencias de dos o más subentidades diferentes.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Un subconjunto es un caso particular de generalización con una sola entidad

como subentidad. Un subconjunto siempre es una jerarquía parcial y exclusiva.
3.8 Metodología de diseño conceptual
El primer paso en el diseño de una base de datos es la producción del

esquema conceptual. Normalmente, se construyen varios esquemas
conceptuales, cada uno para representar las distintas visiones que los usuarios
tienen de la información. Cada una de estas visiones suelen corresponder a las
diferentes áreas funcionales de la empresa como, por ejemplo, producción,
ventas, recursos humanos, etc.
Estas visiones de la información, denominadas vistas, se pueden identificar de

varias formas. Una opción consiste en examinar los diagramas de flujo de
datos, que se pueden haber producido previamente, para identificar cada una
de las áreas funcionales. La otra opción consiste en entrevistar a los usuarios,
examinar los procedimientos, los informes y los formularios, y también observar
el funcionamiento de la empresa.
A los esquemas conceptuales correspondientes a cada vista de usuario se les

denomina esquemas conceptuales locales. Cada uno de estos esquemas se
compone de entidades, relaciones, atributos, dominios de atributos e
identificadores. El esquema conceptual también tendrá una documentación,
que se irá produciendo durante su desarrollo. Las tareas a realizar en el diseño
conceptual son las siguientes:
3.8.1. Identificar las entidades
En primer lugar hay que definir los principales objetos que interesan al usuario.
Estos objetos serán las entidades. Una forma de identificar las entidades es
examinar las especificaciones de requisitos de usuario. En estas
especificaciones se buscan los nombres o los sintagmas nominales que se
22 DE OCTUBRE DE
INFORMÁTICA 2010
mencionan (por ejemplo: número de empleado, nombre de empleado, número

de inmueble, dirección del inmueble, alquiler, número de habitaciones).
También se buscan objetos importantes como personas, lugares o conceptos
de interés, excluyendo aquellos nombres que sólo son propiedades de otros
objetos. Por ejemplo, se pueden agrupar el número de empleado y el nombre
de empleado en una entidad denominada empleado, y agrupar número de
inmueble, dirección del inmueble, alquiler y número de habitaciones en otra
entidad denominada inmueble.
Otra forma de identificar las entidades es buscar aquellos objetos que existen
por sí mismos. Por ejemplo, empleado es una entidad porque los empleados
existen, sepamos o no sus nombres, direcciones y teléfonos. Siempre que sea
posible, el usuario debe colaborar en la identificación de las entidades.
A veces, es difícil identificar las entidades por la forma en que aparecen en las
especificaciones de requisitos. Los usuarios, a veces, hablan utilizando
ejemplos o analogías. En lugar de hablar de empleados en general, hablan de
personas concretas, o bien, hablan de los puestos que ocupan esas personas.
Para liarlo aún más, los usuarios usan, muchas veces, sinónimos y
homónimos. Dos palabras son sinónimos cuando tienen el mismo significado.
Los homónimos ocurren cuando la misma palabra puede tener distintos
significados dependiendo del contexto.
No siempre es obvio saber si un objeto es una entidad, una relación o un

atributo. Por ejemplo ¿cómo se podría clasificar matrimonio? Pues de
cualquiera de las tres formas. El análisis es subjetivo, por lo que distintos
diseñadores pueden hacer distintas interpretaciones, aunque todas igualmente
válidas. Todo depende de la opinión y la experiencia de cada uno. Los
diseñadores de bases de datos deben tener una visión selectiva y clasificar las
cosas que observan dentro del contexto de la empresa u organización. A partir
de unas especificaciones de usuario es posible que no se pueda deducir un
conjunto único de entidades, pero después de varias iteraciones del proceso de

22 DE OCTUBRE DE
INFORMÁTICA 2010
análisis, se llegará a obtener un conjunto de entidades que sean adecuadas

para el sistema que se ha de construir.
Conforme se van identificando las entidades, se les dan nombres que tengan
un significado y que sean obvias para el usuario. Los nombres de las entidades
y sus descripciones se anotan en el diccionario de datos. Cuando sea posible,
se debe anotar también el número aproximado de ocurrencias de cada entidad.
Si una entidad se conoce por varios nombres, éstos se deben anotar en el
diccionario de datos como alias o sinónimos.
3.8.2. Identificar las relaciones
Una vez definidas las entidades, se deben definir las relaciones existentes
entre ellas. Del mismo modo que para identificar las entidades se buscaban
nombres en las especificaciones de requisitos, para identificar las relaciones se
suelen buscar las expresiones verbales (por ejemplo: oficina tiene empleados,
empleado gestiona inmueble, cliente visita inmueble). Si las especificaciones
de requisitos reflejan estas relaciones es porque son importantes para la
empresa y, por lo tanto, se deben reflejar en el esquema conceptual.
Pero sólo interesan las relaciones que son necesarias. En el ejemplo anterior,
se han identificado las relaciones empleado gestiona inmueble y cliente visita
inmueble. Se podría pensar en incluir una relación entre empleado y cliente:
empleado atiende a cliente, pero observando las especificaciones de requisitos
no parece que haya interés en modelar tal relación.
La mayoría de las relaciones son binarias (entre dos entidades), pero no hay
que olvidar que también puede haber relaciones en las que participen más de
dos entidades, así como relaciones recursivas.
Es muy importante repasar las especificaciones para comprobar que todas las
relaciones, explícitas o implícitas, se han encontrado. Si se tienen pocas
entidades, se puede comprobar por parejas si hay alguna relación entre ellas.
De todos modos, las relaciones que no se identifican ahora se suelen encontrar
cuando se valida el esquema con las transacciones que debe soportar.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Una vez identificadas todas las relaciones, hay que determinar la cardinalidad
mínima y máxima con la que participa cada entidad en cada una de ellas. De
este modo, el esquema representa de un modo más explícito la semántica de
las relaciones. La cardinalidad es un tipo de restricción que se utiliza para
comprobar y mantener la calidad de los datos. Estas restricciones son
aserciones sobre las entidades que se pueden aplicar cuando se actualiza la
base de datos para determinar si las actualizaciones violan o no las reglas
establecidas sobre la semántica de los datos.
Conforme se van identificando las relaciones, se les van asignando nombres

que tengan significado para el usuario. En el diccionario de datos se anotan los
nombres de las relaciones, su descripción y las cardinalidades con las que
participan las entidades en ellas.
3.8.3. Identificar los atributos y asociarlos a entidades y relaciones
Al igual que con las entidades, se buscan nombres en las especificaciones de

requisitos. Son atributos los nombres que identifican propiedades, cualidades,
identificadores o características de entidades o relaciones.
Lo más sencillo es preguntarse, para cada entidad y cada relación, ¿qué

información se quiere saber de? La respuesta a esta pregunta se debe
encontrar en las especificaciones de requisitos. Pero, en ocasiones, será
necesario preguntar a los usuarios para que aclaren los requisitos.
Desgraciadamente, los usuarios pueden dar respuestas a esta pregunta que
también contengan otros conceptos, por lo que hay que considerar sus
respuestas con mucho cuidado.
Al identificar los atributos, hay que tener en cuenta si son simples o

compuestos. Por ejemplo, el atributo dirección puede ser simple, teniendo la
dirección completa como un solo valor: `San Rafael 45, Almazora'; o puede ser
un atributo compuesto, formado por la calle (`San Rafael'), el número (`45') y la
población (`Almazora'). El escoger entre atributo simple o compuesto depende
de los requisitos del usuario. Si el usuario no necesita acceder a cada uno de
los componentes de la dirección por separado, se puede representar como un

22 DE OCTUBRE DE
INFORMÁTICA 2010
atributo simple. Pero si el usuario quiere acceder a los componentes de forma

individual, entonces se debe representar como un atributo compuesto.
También se deben identificar los atributos derivados o calculados, que son

aquellos cuyo valor se puede calcular a partir de los valores de otros atributos.
Por ejemplo, el número de empleados de cada oficina, la edad de los
empleados o el número de inmuebles que gestiona cada empleado. Algunos
diseñadores no representan los atributos derivados en los esquemas
conceptuales. Si se hace, se debe indicar claramente que el atributo es
derivado y a partir de qué atributos se obtiene su valor. Donde hay que
considerar los atributos derivados es en el diseño físico.
Cuando se están identificando los atributos, se puede descubrir alguna entidad

que no se ha identificado previamente, por lo que hay que volver al principio
introduciendo esta entidad y viendo si se relaciona con otras entidades.
Es muy útil elaborar una lista de atributos e ir eliminándolos de la lista conforme

se vayan asociando a una entidad o relación. De este modo, uno se puede
asegurar de que cada atributo se asocia a una sola entidad o relación, y que
cuando la lista se ha acabado, se han asociado todos los atributos.
Hay que tener mucho cuidado cuando parece que un mismo atributo se debe
asociar a varias entidades. Esto puede ser por una de las siguientes causas:
 Se han identificado varias entidades, como director, supervisor y

administrativo, cuando, de hecho, pueden representarse como una sola
entidad denominada empleado. En este caso, se puede escoger entre
introducir una jerarquía de generalización, o dejar las entidades que
representan cada uno de los puestos de empleado.
 Se ha identificado una relación entre entidades. En este caso, se debe
asociar el atributo a una sola de las entidades y hay que asegurarse de
que la relación ya se había identificado previamente. Si no es así, se
debe actualizar la documentación para recoger la nueva relación.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Conforme se van identificando los atributos, se les asignan nombres que

tengan significado para el usuario. De cada atributo se debe anotar la siguiente
información:
 Nombre y descripción del atributo.

 Alias o sinónimos por los que se conoce al atributo.
 Tipo de dato y longitud.
 Valores por defecto del atributo (si se especifican).
 Si el atributo siempre va a tener un valor (si admite o no nulos).
 Si el atributo es compuesto y, en su caso, qué atributos simples lo
forman.
 Si el atributo es derivado y, en su caso, cómo se calcula su valor.
 Si el atributo es multievaluado.
3.8.4. Determinar los dominios de los atributos
El dominio de un atributo es el conjunto de valores que puede tomar el atributo.

Por ejemplo el dominio de los números de oficina son las tiras de hasta tres
caracteres en donde el primero es una letra y el siguiente o los dos siguientes
son dígitos en el rango de 1 a 99; el dominio de los números de teléfono y los
números de fax son las tiras de 9 dígitos.
Un esquema conceptual está completo si incluye los dominios de cada atributo:

los valores permitidos para cada atributo, su tamaño y su formato. También se
puede incluir información adicional sobre los dominios como, por ejemplo, las
operaciones que se pueden realizar sobre cada atributo, qué atributos pueden
compararse entre sí o qué atributos pueden combinarse con otros. Aunque
sería muy interesante que el sistema final respetara todas estas indicaciones
sobre los dominios, esto es todavía una línea abierta de investigación.
Toda la información sobre los dominios se debe anotar también en el

diccionario de datos.
3.8.5. Determinar los identificadores

22 DE OCTUBRE DE
INFORMÁTICA 2010
Cada entidad tiene al menos un identificador. En este paso, se trata de

encontrar todos los identificadores de cada una de las entidades. Los
identificadores pueden ser simples o compuestos. De cada entidad se
escogerá uno de los identificadores como clave primaria en la fase del diseño
lógico.
Cuando se determinan los identificadores es fácil darse cuenta de si una

entidad es fuerte o débil. Si una entidad tiene al menos un identificador, es
fuerte (otras denominaciones son padre, propietaria o dominante). Si una
entidad no tiene atributos que le sirvan de identificador, es débil (otras
denominaciones son hijo, dependiente o subordinada).
Todos los identificadores de las entidades se deben anotar en el diccionario de

datos.
3.8.6. Determinar las jerarquías de generalización
En este paso hay que observar las entidades que se han identificado hasta el
momento. Hay que ver si es necesario reflejar las diferencias entre distintas
ocurrencias de una entidad, con lo que surgirán nuevas subentidades de esta
entidad genérica; o bien, si hay entidades que tienen características en común
y que realmente son subentidades de una nueva entidad genérica.
En cada jerarquía hay que determinar si es total o parcial y exclusiva o

superpuesta.
3.8.7. Dibujar el diagrama entidad-relación
Una vez identificados todos los conceptos, se puede dibujar el diagrama

entidad-relación correspondiente a una de las vistas de los usuarios. Se
obtiene así un esquema conceptual local.
3.8.8. Revisar el esquema conceptual local con el usuario
Antes de dar por finalizada la fase del diseño conceptual, se debe revisar el
esquema conceptual local con el usuario. Este esquema está formado por el

22 DE OCTUBRE DE
INFORMÁTICA 2010
diagrama entidad-relación y toda la documentación que describe el esquema.

Si se encuentra alguna anomalía, hay que corregirla haciendo los cambios
oportunos, por lo que posiblemente haya que repetir alguno de los pasos
anteriores. Este proceso debe repetirse hasta que se esté seguro de que el
esquema conceptual es una fiel representación de la parte de la empresa que
se está tratando de modelar.
3.9. Concepto de campos
Las tablas se componen de campos (columnas) y registros (filas). Un campo es

una categoría de información, como Nombre, Dirección, Ciudad. En una tabla,
un campo corresponde a una columna.
Un campo es un espacio de almacenamiento para un dato en particular. En las

bases de datos, un campo es la mínima unidad de información a la que se
puede acceder; un campo o un conjunto de ellos forman un registro, donde
pueden existir campos en blanco, siendo éste un error del sistema. En las hojas
de cálculo los campos son llamados celdas. La mayoría de los campos tienen
atributos asociados a ellos. Por ejemplo, algunos campos son numéricos
mientras otros almacenan texto, también varía el tamaño de estos.
Adicionalmente, cada campo tiene un nombre.
Un campo es un dato constituido por una serie de caracteres. La cantidad de

información que debe contener un campo se determina por las necesidades del
problema.
Los campos comunes entre tablas son los que hacen posibles las bases de
datos relacionales. Si mantiene los nombres y direcciones de los clientes en la
misma tabla, tendrá que introducir la dirección de un cliente cada vez que el
cliente realice un pedido. O cuando cambie una dirección, deberá actualizar
todos los pedidos realizados por ese cliente.

22 DE OCTUBRE DE
INFORMÁTICA 2010
3.10. Tipos de campos
La mayoría de los campos en una base de datos son del tipo numérico o
alfanumérico, aunque habrá veces en que se necesiten todos los tipos de
campos. A continuación se enlistan los tipos de campos más utilizados:
 Campos de carácter o texto: se usan para almacenar algunos

caracteres que incluyen las letras, números, algunos símbolos
especiales o los espacios en blanco. Un campo carácter/texto puede
tener un tamaño máximo de 254 caracteres.
 Campos de fecha: se usan para almacenar fechas. El formato normal
para introducir fechas es DD/MM/AA. Las líneas diagonales las inserta
automáticamente Visual Fox-pro, a medida que se introduce la fecha en
un campo tipo fecha.
 Campos numéricos: se usan números con o sin dígitos decimales. Solo
se pueden introducir números y el signo menos (el guión); no se utilizan
comas para números mayores de 1000.
 Campos lógicos: consisten en una sola letra que representa un valor
verdadero o falso.
 Campos memo: puede almacenar grandes bloques de texto por cada
registro en forma de campo memo.
A continuación se definen los nombres y tipos de campos del diseño de la base

de datos.
3.11. Longitudes de campos
Longitud fija de un campo. Cada campo debe tener el tamaño necesario para
poder albergar la información del dato que lo caracteriza. Ahora bien, la
longitud de la información puede ser variable. Por ejemplo, tenemos la lista de
nombres:
La longitud fija en el tamaño de campo produce un desperdicio de lugar, pero

en cambio facilita la localización y la extracción de la información de dicho
campo, al no tener que preocuparse por su tamaño, por ejemplo:

22 DE OCTUBRE DE
INFORMÁTICA 2010
A continuación definiremos las longitudes de cada uno de los campos de la lista

de anterior:
4. Normalización
La normalización convierte una relación en varias sub-relaciones, cada una de

las cuales obedece a reglas. Estas reglas se describen en términos de
dependencia. Una vez que hayamos examinado las distintas formas de
dependencia, encontraremos procedimientos a aplicar a las relaciones de
modo tal que las mismas puedan descomponerse de acuerdo a la dependencia
que prevalece. Esto no llevará indefectiblemente a formar varias subrelaciones
a partir de la única relación preexistente. Es un proceso que clasifica
relaciones, objetos, formas de relación y demás elementos en grupos, en base
a las características que cada uno posee. Si se identifican ciertas reglas, se
aplica un categoría; si se definen otras reglas, se aplicará otra categoría.
La forma de efectuar esto es a través de los tipos de dependencias que

podemos determinar dentro de la relación. Cuando las reglas de clasificación
sean más y más restrictivas, diremos que la relación está en una forma normal
más elevada. La relación que está en la forma normal más elevada posible es
que mejor se adapta a nuestras necesidades debido a que optimiza las
condiciones que son de importancia para nosotros
4.1 Dependencia
Los individuos tienen muchos atributos que pueden ser de interés a diferentes
personas en diferentes momentos. Nuestro problema actual es con una sola
aplicación o conjunto de aplicaciones: solemne son de interés algunos de los
atributos.
Los símbolos aplicables a la relación han sido introducidos previamente.
 R es una tupla general o vector que describe a un individuo;
 R es una relación, una matriz o un conjunto de vectores que pertenecen

la población de interés.

22 DE OCTUBRE DE
INFORMÁTICA 2010
 U es el universo consistente en todas las posibles descripciones

individuales, obtenido mediante una combinación exhaustiva de los
valores a atributos.
La tupla general toma la siguiente forma
R = (a, b, c, ...., n) La pertenencia con respecto a relaciones, tuplas y universos

se indica mediante. Con respecto a los atributos:
• A es el símbolo del nombre de un atributo
• a es el símbolo de un valor del atributo.
Dominio (A) es el dominio para el atributo cuyo nombre es A.
Existen tres tipos distintos de dependencia.
 Total uno-uno-sinónimo
 Completa - subtupla
 Transitiva - múltiple.
La dependencia es una relación funcional que penetra en el universo de

posibilidades. La dependencia no puede deducirse solamente de los datos de
nuestra, ya que éstos son necesariamente incompletos, sino que debe ser
inherente al comportamiento del sistema.
4.2 Dependencia Total
Consideremos los atributos x e y. Cada valor de x tiene uno y solo un valor de y

asociados a el; e inversamente, dado un valor de y existe solamente un valor
de x asociado a éste. Se trata de una función unitaria de una variable tanto en
sentido directo como inverso y por o tanto se denomina dependencia total. Otra
forma de expresar lo mismo es decir que x e y son sinónimos; ambas
expresiones son equivalentes.
4.3 Dependencia Completa
El concepto de dependencia completa se aplica solamente cuando:

22 DE OCTUBRE DE
INFORMÁTICA 2010
 Tenemos más de dos variables, y
 Una variable dependiente depende de dos o más variables

independientes.
Consideramos una relación que abarca las variables P, Q y R. Supongamos

que P es la variable dependiente. Si el valor de P está determinado por una
función de Q y R combinados, se trata de una dependencia completa. Esto es,
el valor de P no depende únicamente ni de Q ni de R.
4.5 Dependencia transitiva
La dependencia transitiva se aplica o tres o más variables. Consideremos el

caso de solo tres variables y llamémoslas S, T y V.
Diremos que S es la variable independiente si los valores de S determinan

tanto a T como a V, y se simbolizará así:
S ----> T; S ----> V
Sin embargo, sería deseable encontrar una relación más restrictiva o definida.
Tenemos dependencia transitiva cuando S determina a T y V, pero los valores

de V pueden considerarse siempre como dependiendo de los valores de T.
4.6 Reducción
Si podemos manejar las dependencias transitivas, podremos reducir el espacio

total requerido para almacenar los datos. Varios valores de S pueden generar
un único valor de T. De modo similar, pueden existir varios valores de T
asociados solamente con un valor de V. La separación de estas relaciones
permite conservar espacios.
4.7 Primera forma normal
Para que una relación esté en primera forma normal (1 FN), debe ser
solamente una relación propia, una matríz m por n, donde:
 Ninguna celda de la matriz está vacía;

22 DE OCTUBRE DE
INFORMÁTICA 2010
 El valor n cualquier columna está definido por el dominio para dicho

atributo.
 Cada tupla tiene una clave que la identifica en forma unívoca, pero dicha
clave no significa orden.
La aplicación determina la relación
Para que una relación sea normalizada en pasos adicionales, debe encontrarse
en la primera forma normal. Colocar los datos en la primera forma normal está
a cargo del diseñador de la aplicación. Estos datos se encuentran disponibles
de alguna manera inicialmente. Si la aplicación existe en forma manual, o ha
sido anteriormente computarizada pero no todavía como relación, el diseñador
reorganiza los datos de modo de conformar una matríz 1FN.
La segunda inicial más importante es la dimensión de la relación ¿cuántos

componentes existen en la tupla o cuántas columnas en la tabla? ¿De qué
manera se compara esto con el número de campos en el documento fuente?
Dado que una tupla debe tener un número fijo de componentes, necesitamos
una tupla en primera forma normal para cada parte de cada pedido
Por lo tanto cada tupla consiste en una parte de datos que son variables y
datos del pedido que se duplican para cada parte ordenada.
4.8 Grafo de Dependencia
Una vez que los datos han sido puestos en primera forma normal, resulta
conveniente descomponer la relación en un número de relaciones más
pequeñas, cada una en forma normal superior, de modo de optimizar el
almacenamiento y usar sus funciones.
Para esto resulta necesario reconocer las dependencias existentes. Un grafo

exhibe los distintos tipos de dependencias que existen, y enfatizan que hemos
investigado completamente cada dependencia.
El grafo simple no está diseñado para mostrar dependencias. Para hacer

utilizable a este grafo, se agregan colores pueden expresarse en blanco y

22 DE OCTUBRE DE
INFORMÁTICA 2010
negro mediante distintos tipos de líneas. Discutiremos estos tipos de líneas en

términos de la dependencia que cada uno representa. En las figuras que
siguen las formas gráficas aparecen a la izquierda y se utilizan para constituir
un grafo completo. A la derecha se puede observar una forma simbólica para
describir dependencias únicas.
4.9 Dependencia única
En la figura vemos un arco que conecta dos vértices A y B. A es la cola y B es

la cabeza de la "flecha". Esto significa que B depende de A. Es decir dado un
valor de A podemos predecir de A. Es decir, dado un valor de A podemos
predecir cuál será el valor de B.
4.10 Dependencia total
La dependencia total se define como una dependencia bilateral o simétrica. Es

decir, si C depende de D, en consecuencia D será dependiente en forma
similar de C. Esto se expresa en la figura mediante una arista (sin una flecha)
que une C y D.
4.11 Dependencia completa
La variable G depende en forma completa de otras dos variables E y F, lo cual

puede ilustrarse como se ve a la izquierda de la figura. Pero así no es
representada adecuadamente la dependencia completa, ya que el valor de G
no depende de E o F, independiente, sino que depende de ambos valores.
4.12 Dependencia transitiva
Supongamos que dos variables, K y L, dependen de J. Si puede verificarse que

L depende en forma primaria de K, existiría una dependencia transitiva.
4.13 Descripción De La Segunda Forma Normal (2 Fn)

22 DE OCTUBRE DE
INFORMÁTICA 2010
Su nombre ya nos indica el hecho de que la segunda forma normal es por lo

general el próximo paso de normalización y descomposición. Para ser
accesible a la normalización, y poder ser puesta en segunda forma normal, la
relación debe poseer las siguientes propiedades:
 Debe estar en primera forma normal
 Debe tener una clave compuesta.
La consecuencia inmediata de los requerimientos expresados más arriba es

que cualquier relación en primera forma normal que tiene una clave simple,
está automáticamente en segunda forma normal.
El próximo paso es crear un grafo de dependencia, presentando aquí como

figura. Debe notarse que este grafo se crea examinado con conocimientos y
atributos para determinar como participan y relacionan entre ellos.
No resulta suficiente analizar la matríz de relación, la cual puede hacernos

creer que existe una dependencia debido a que la muestra de la cual se ha
extraído dicha relación es pequeña. Si somos inducidos a error por los datos
existentes y construimos una dependencia donde esta no existe, se planteará
un problema. Cuando lleguen nuevos datos que contradigan la dependencia,
deberá dejarse de lado el esquema completo.
Supongamos en consecuencia que el grafo que se puede observar en la figura

ha sido derivado en forma funcional y que expresa correctamente las
dependencias. Resulta claro a partir de este grafo que los atributos que parten
de P son dependientes solamente de este. De un modo similar los que parten
de Q dependen solamente de este último. Solamente aquellos que parten de la
línea de trazos que conecta a P y Q tienen dependencia completa de ambos.
4.14 Proyección
El próximo paso es proyectar la relación R sobre cada una de estas subtuplas

para formar tres nuevas relaciones, y en consecuencia.
Una subrelación es la relación que deriva de una relación mayor.

22 DE OCTUBRE DE
INFORMÁTICA 2010
4.15 Grafos
La nueva sub-relación que se ve en la figura se presenta en forma de grafo en

la figura siguiente. Existe una considerable analogía entres estas figuras y la
figura anterior. Lo importante es la diferencia.
4.16 Efectos
El efecto de esta descomposición puede no resultar inmediatamente claro.

Debemos insistir en que ninguna relación correcta debe contener tuplas
duplicadas. Las mismas han sido eliminadas durante la descomposición. Esto
facilita en forma extraordinaria la actualización y otras importantes operaciones
que afectan a estas relaciones.
4.17 Arbol de Dependencia
El medio para descomponer la relación es el árbol de dependencia que se ve

en la figura. Este árbol ha sido construido solamente teniendo en cuenta la
dependencia completa, y no muestra las dependencias total o transitiva, que se
describe más adelante, si es que las mismas existen.
4.18 Efecto
Discutiremos ahora algunas de las ventajas obtenidas mediante la

descomposición. Si estas relaciones se utilizan para el control de inventario.
nuestra preocupación será cuantas piezas de cada tipo están disponibles en un
depósito en particular. Cuando se retiran piezas o se reciben nuevos envíos la
cantidad disponible, QOH será la variable de cambio. La actualización consiste
en poner al día sub-relación P/W la cual ahora contiene solamente malos
componentes en lugar de los nuevos P/W.
Existe una tupla P en la sub-relación de pieza o parte, P, para cada parte y una
tupla. W, en la sub relación W, para cada depósito y estos últimos
probablemente no serán muchos. Consideremos la facilidad de efectuar
cambios en un depósito en particular. Si un atributo de uno de los depósitos
varía entraremos en W para efectuar el cambio solamente en una tupla.
4.19 Tercera forma normal

22 DE OCTUBRE DE
INFORMÁTICA 2010
Una relación se encuentra en tercera forma normal (EFN) si no existen

transitividades entre sus atributos y si ya se encuentra en 2 FN.
4.20 Descripción
Una relación R a poner en tercera forma normal debe estar en la segunda

forma normal. Es muy común que R sea una sub-relación; la relación original
estaba en primera forma normal (para ponerla en segunda forma normal fue
descompuesta en varias sub-relaciones). Estas son ahora candidatas a una
descomposición adicional.
Recordamos que las propiedades de la segunda forma normal (2Fn) son:
 Tenemos una matríz m x n con un valor determinado para cada

componente de cada tupla.
 Cada valor es obtenido a partir de un dominio propiamente definimos
 Cada valor contiene una clave, ya sea simple o compuesta
 Cada componente no clave es dependiente en forma completa de su

clave.
En consecuencia es evidente que tenemos, o bien una clave simple, o una

clave compuesta de la cual todos los componentes no clave son dependientes
en forma completa.
Tal dependencia puede expresarse como:
Q ---> A ----> B
En la cual se dice que B depende de A y que A depende de Q. La transitividad

existe debido a que el valor de B depende en la última instancia del valor de Q.
La dependencia transitiva es degenerada si cualquiera de las dependencias

anteriores es total. Esto es, podemos prever que la relación de Q a A es
muchos-unos, donde varios valor único de A. Dado un valor tal Q el valor de A
queda determinado. La inversa no se aplica y en consecuencia no existe una

22 DE OCTUBRE DE
INFORMÁTICA 2010
dependencia total: dado un valor de A el valor correspondiente de Q no queda

determinado a menos de que se trate de una dependencia total.
El ahorro que surge de colocar la relación en tercera forma normal aparece a

raíz de la granularidad del dominio involucrado.
4.21 Determinación de la dependencia transitiva
Si el grafo utilizado para llevar la relación a la segunda forma normal es

completo en termino de las transitividades existentes, no resulta necesario un
grafo adicional. El grafo para convertir a la segunda forma normal requiere
solamente que todas las dependencias completas y parciales sean conocidas.
4.22 Transitividad simple
Para la dependencia transitiva unilateral, la variable independiente apunta a la

variable dependiente, tal cual se presenta en el figura donde B depende de A.
El arco entre B y Q ha sido eliminando; la dependencia implícita de B respecto
de Q resulta obvia.
4.23 Descomposición
Dada una sub-relación con una o más dependencias transitivas, la

descomposición consiste en partir la relación en una o más de una sub-
relación, donde la variable intermedia aparezca como variable dependiente en
una y como variable independiente en la otra.
4.25 Cuarta forma normal
 Dependencias multivaluadas
La tercera forma normal toma en cuenta la dependencia transitiva y provee una

reducción óptima universal, excepto para los casos infrecuentes de
dependencia multivaluadas. Ha quedado claro en épocas recientes que es

22 DE OCTUBRE DE
INFORMÁTICA 2010
posible una reducción adicional en este caso, y esto es lo que se lleva a cabo
mediante la cuarta forma normal.
Existe una dependencia multivaluada cuando un valor de una variable está

siempre asociado con varios valores de otra u otras variables dependientes que
son siempre las mismas y están siempre presentes.
La ineficiencia en el registro de información y se resulta clara al examinar las

dos nuevas relaciones.
Descomposición Para poner una relación o sub-relación en la cuarta forma

normal debe poder aplicarse lo siguiente:
 Debe estar en la tercera forma normal.
 Deben existir una o mas multidependencias.
Después de construir el grafo de dependencia, el próximo paso es ejecutar

proyecciones utilizando la variable independiente y una de las variables
multidependientes.
El resultado son nuevas sub-relaciones que han sido utilizadas para ahorra
espacio y permitir una más fácil actualización.
El grafo de dependencia. El mismo nos muestra una dependencia total entre el

número de curso y la descripción del curso. Existe una multidependencia entre
texto y número de curso, y también entre profesor y número de curso.
Para descomponer la sub-relación en sus relaciones más pequeñas, se

efectúan tres proyecciones. Las sub-relaciones resultantes.
5. Marco Antonio: Organización de los Registros.

22 DE OCTUBRE DE
INFORMÁTICA 2010
6. Manejo de Datos:
Cuando nos referimos al manejo de datos, hablamos del encargado de

almacenar y recuperar los datos específicamente. Los sistemas modernos para
el manejo de datos aíslan por completo al usuario de los complejos procesos
que implican el almacenamiento físico de la información. Los programas
utilizados para organizar datos digitales son los llamados Sistemas de Gestión
de Bases de Datos (SGBD)
Un sistema de manejo de datos son todos los procedimientos utilizados para la

entrada, procesamiento y salida datos junto con la infraestructura de
computadoras en las cuales se realiza este manejo de datos.
Las técnicas de manejo de datos son el resultado de un largo proceso de

investigación y desarrollo de productos. Esta evolución comenzó cuando los
datos de negocios fueron almacenados por primera vez en computadoras, y
continuó con mejoras en el acceso a los datos, y más recientemente con
tecnologías generadas para permitir a los usuarios navegar a través de los
datos en tiempo real. El manejo de datos está listo para su aplicación en la
comunidad de negocios porque está soportado por tres tecnologías que están
lo suficientemente maduras:
 Recolección masiva de datos
 Potentes computadoras con multiprocesadores
 Algoritmos de datos
6.1 Principales características y objetivos del manejo de datos:

22 DE OCTUBRE DE
INFORMÁTICA 2010
 Explorar los datos que se encuentran en las profundidades de las bases

de datos, como los almacenes de datos que contienen información
almacenada durante varios años
 En algunos casos, los datos se consolidan en un almacén y mercados

de datos; en otros, se mantienen en servidores de Internet e Intranet
 El entorno del manejo de datos suele tener una arquitectura cliente –

servidor
 Las herramientas del manejo de datos ayudan a extraer el material de la

información enterrado en archivos corporativos o en registros públicos,
archivados.
6.2 Agregar Datos, Modificar, Borrar, Generar Reportes:
A través del manejo de datos, podemos realizar muchas actividades

encaminadas a mejorar un funcionamiento, reescribir datos, eliminarlo o bien
generar reportes.
 Agregar datos: significa sumar valores a una base de datos, ya sea un

archivo, un programa o cualquier extensión informática que se este
operando.
 Modificar: esto no es más que cambiar los datos de un ordenador,

parcial o totalmente.
 Borrar: actividad que se realiza para eliminar parcial o totalmente uno o

mas datos, archivos o programas que estén operando en el ordenador.
 Generar Reportes: no es más que reportes de cualquier naturaleza, los

cuales pueden imprimirse por el usuario en segundos.

22 DE OCTUBRE DE
INFORMÁTICA 2010
7. Base de Datos Relacional:
Una base de datos relacional es una base de datos que cumple con el modelo
relacional, el cual es el modelo más utilizado en la actualidad para implementar
bases de datos ya planificadas. Permiten establecer interconexiones
(relaciones) entre los datos (que están guardados en tablas), y a través de
dichas conexiones relacionar los datos de ambas tablas, de ahí proviene su
nombre: "Modelo Relacional". Tras ser postuladas sus bases en 1970 por
Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos.
7.1 Características
 Una base de datos relacional se compone de varias tablas o relaciones.

 No pueden existir dos tablas con el mismo nombre.
 Cada tabla es a su vez un conjunto de registros (filas y columnas).
 La relación entre una tabla padre y un hijo se lleva a cabo por medio de
las claves primarias y ajenas (o foráneas).
 Las claves primarias son la clave principal de un registro dentro de una
tabla y éstas deben cumplir con la integridad de datos.
 Las claves ajenas se colocan en la tabla hija, contienen el mismo valor
que la clave primaria del registro padre; por medio de éstas se hacen las
relaciones.
7.2 Elementos
 Relaciones base y derivadas:
En una base de datos relacional, todos los datos se almacenan y se accede a

ellos por medio de relaciones. Las relaciones que almacenan datos son
llamadas "relaciones base" y su implementación es llamada "tabla". Otras
relaciones no almacenan datos, pero son calculadas al aplicar operaciones
22 DE OCTUBRE DE
INFORMÁTICA 2010
relacionales. Estas relaciones son llamadas "relaciones derivadas" y su

implementación es llamada "vista" o "consulta". Las relaciones derivadas son
convenientes ya que expresan información de varias relaciones actuando como
si fuera una sola.
 Restricciones:
Una restricción es una condición que obliga el cumplimiento de ciertas

condiciones en la base de datos. Algunas no son determinadas por los
usuarios, sino que son inherentemente definidas por el simple hecho de que la
base de datos sea relacional. Algunas otras restricciones las puede definir el
usuario, por ejemplo, usar un campo con valores enteros entre 1 y 10.
Las restricciones proveen un método de implementar reglas en la base de

datos. Las restricciones restringen los datos que pueden ser almacenados en
las tablas. Usualmente se definen usando expresiones que dan como resultado
un valor booleano, indicando si los datos satisfacen la restricción o no.
Las restricciones no son parte formal del modelo relacional, pero son incluidas
porque juegan el rol de organizar mejor los datos. Las restricciones son muy
discutidas junto con los conceptos relacionales.
 Dominios:
Un dominio describe un conjunto de posibles valores para cierto atributo. Como

un dominio restringe los valores del atributo, puede ser considerado como una
restricción. Matemáticamente, atribuir un dominio a un atributo significa "todos
los valores de este atributo deben de ser elementos del conjunto especificado".
Distintos tipos de dominios son: enteros, cadenas de texto, fecha, número

procedurales etc.
 Clave única:
Cada tabla puede tener uno o más campos cuyos valores identifican de forma
única cada registro de dicha tabla, es decir, no pueden existir dos o más

22 DE OCTUBRE DE
INFORMÁTICA 2010
registros diferentes cuyos valores en dichos campos sean idénticos. Este

conjunto de campos se llama clave única.
Pueden existir varias claves únicas en una determinada tabla, y a cada una de
éstas suele llamársele candidata a clave primaria.
 Clave primaria:
Una clave primaria es una clave única elegida entre todas las candidatas que
define univocamente a todos los demas atributos de la tabla, para especificar
los datos que serán relacionados con las demás tablas. La forma de hacer esto
es por medio de claves foráneas.
Sólo puede existir una clave primaria por tabla y ningún campo de dicha clave
puede contener valores NULL.
 Clave foránea:
Una clave foránea es una referencia a una clave en otra tabla. Las claves
foráneas no necesitan ser claves únicas en la tabla donde están y sí a donde
están referenciadas. Por ejemplo, el código de departamento puede ser una
clave foránea en la tabla de empleados, obviamente se permite que haya
varios empleados en un mismo departamento, pero existirá sólo un
departamento.
 Clave índice:
Las claves índices surgen con la necesidad de tener un acceso más rápido a
los datos. Los índices pueden ser creados con cualquier combinación de
campos de una tabla. Las consultas que filtran registros por medio de estos
campos, pueden encontrar los registros de forma no secuencial usando la clave
índice.

22 DE OCTUBRE DE
INFORMÁTICA 2010
Las bases de datos relacionales incluyen múltiples técnicas de ordenamiento,

cada una de ellas es óptima para cierta distribución de datos y tamaño de la
relación. Los índices generalmente no se consideran parte de la base de datos,
pues son un detalle agregado. Sin embargo, las claves índices son
desarrolladas por el mismo grupo de programadores que las otras partes de la
base de datos.
 Procedimientos almacenados:
Un procedimiento almacenado es código ejecutable que se asocia y se

almacena con la base de datos. Los procedimientos almacenados usualmente
recogen y personalizan operaciones comunes, como insertar un registro dentro
de una tabla, recopilar información estadística, o encapsular cálculos
complejos. Son frecuentemente usados por un API por seguridad o simplicidad.
Los procedimientos almacenados no son parte del modelo relacional, pero
todas las implementaciones comerciales los incluyen.
 Estructura
La base de datos se organiza en dos marcadas secciones; el esquema y los

datos (o instancia). El esquema es la definición de la estructura de la base de
datos y principalmente almacena los siguientes datos:
 El nombre de cada tabla

 El nombre de cada columna
 El tipo de dato de cada columna
 La tabla a la que pertenece cada columna
Las bases de datos relacionales pasan por un proceso al que se le conoce

como normalización, el resultado de dicho proceso es un esquema que permite
que la base de datos sea usada de manera óptima. Los datos o instancia es el

22 DE OCTUBRE DE
INFORMÁTICA 2010
contenido de la base de datos en un momento dado. Es en sí, el contenido de

todos los registros.
 Manipulación de la información
Para manipular la información utilizamos un lenguaje relacional, actualmente se

cuenta con dos lenguajes formales el álgebra relacional y el cálculo relacional.
El álgebra relacional permite describir la forma de realizar una consulta, en
cambio, el cálculo relacional sólo indica lo que se desea devolver.
El lenguaje más común para construir las consultas a bases de datos

relacionales es SQL (Structured Query Language), un estándar implementado
por los principales motores o sistemas de gestión de bases de datos
relacionales.
En el modelo relacional los atributos deben estar explícitamente relacionados a

un nombre en todas las operaciones, en cambio, el estándar SQL permite usar
columnas sin nombre en conjuntos de resultados, como el asterisco
taquigráfico (*) como notación de consultas.
Al contrario del modelo relacional, el estándar SQL requiere que las columnas
tengan un orden definido, lo cual es fácil de implementar en una computadora,
ya que la memoria es lineal.
Es de notar, sin embargo, que en SQL el orden de las columnas y los registros
devueltos en cierto conjunto de resultado nunca está garantizado, a no ser que
explícitamente sea especificado por el usuario.
7.3 Ventajas y desventajas
Ventajas
 Provee herramientas que garantizan evitar la duplicidad de registros.

22 DE OCTUBRE DE
INFORMÁTICA 2010
 Garantiza la integridad referencial, así, al eliminar un registro elimina

todos los registros relacionados dependientes.
 Favorece la normalización por ser más comprensible y aplicable.
Desventajas
 Presentan deficiencias con datos gráficos, multimedia, CAD y sistemas

de información geográfica.
 No se manipulan de forma manejable los bloques de texto como tipo de
dato.
Las bases de datos orientadas a objetos (BDOO) se propusieron con el objetivo

de satisfacer las necesidades de las aplicaciones anteriores y así,
complementar pero no sustituir a las bases de datos relacionales.

Investigacion Base de Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Investigacion Base de Datos

Cargado por

Copyright:

Formatos disponibles

22 DE OCTUBRE DE

1. ¿Qué es una Base de datos?

Una base de datos o banco de datos (en ocasiones abreviada B.D.D.) es un

Existen programas denominados sistemas gestores de bases de datos,

Las aplicaciones más usuales son para la gestión de empresas e instituciones

Es un elemento tomado de un conjunto de símbolos. Un ejemplo de un

Es una representación simbólica (numérica, alfabética, algorítmica etc.), un

En programación, un dato es la expresión general que describe las

En Estructura de datos, es la parte mínima de la información.

Un dato por sí mismo no constituye información, es el procesamiento de los

En informática, un campo es un espacio de almacenamiento para un dato en

CIENCIAS ECONOMICAS 8vo. CICLO 2

2.4 Tipos de Campo

Un campo puede ser:

Un registro informático es un tipo o conjunto de datos almacenados en un

CIENCIAS ECONOMICAS 8vo. CICLO 3

Un archivo o fichero informático es un conjunto de bits almacenado en un

Un archivo es identificado por un nombre y la descripción de la carpeta o

En lo que concierne al sistema operativo, un archivo es, en la mayoría de los

3. Conceptos para el diseño de base de datos

El diseño de una base de datos es un proceso complejo que abarca decisiones

CIENCIAS ECONOMICAS 8vo. CICLO 4

El diseño conceptual parte de las especificaciones de requisitos de usuario y su

El diseño lógico parte del esquema conceptual y da como resultado un

El diseño físico parte del esquema lógico y da como resultado un esquema

3.1 Modelos de datos

Un modelo de datos es una serie de conceptos que puede utilizarse para

CIENCIAS ECONOMICAS 8vo. CICLO 5

descripciones de los datos tienen una correspondencia sencilla con la

En el diseño de bases de datos se usan primero los modelos conceptuales

Los modelos conceptuales deben ser buenas herramientas para representar la

 Expresividad: deben tener suficientes conceptos para expresar

En general, un modelo no es capaz de expresar todas las propiedades de una

3.2 El modelo entidad-relación

El modelo entidad-relación es el modelo conceptual más utilizado para el

Originalmente, el modelo entidad-relación sólo incluía los conceptos de entidad,

CIENCIAS ECONOMICAS 8vo. CICLO 6

compuestos y las jerarquías de generalización, en lo que se ha denominado

Figura 6.1: Conceptos del modelo entidad-relación extendido.

Cualquier tipo de objeto o concepto sobre el que se recoge información: cosa,

3.4 Relación (interrelación)

CIENCIAS ECONOMICAS 8vo. CICLO 7

Es una correspondencia o asociación entre dos o más entidades. Cada relación

Las entidades que están involucradas en una determinada relación se

La cardinalidad con la que una entidad participa en una relación especifica el

A veces, surgen problemas cuando se está diseñado un esquema conceptual.

Una de las trampas que pueden encontrarse ocurre cuando el esquema

CIENCIAS ECONOMICAS 8vo. CICLO 8

Otra de las trampas sucede cuando un esquema sugiere la existencia de una

Es una característica de interés o un hecho sobre una entidad o sobre una

Cada atributo tiene un conjunto de valores asociados denominado dominio. El

Los atributos pueden ser simples o compuestos. Un atributo simple es un

Los atributos también pueden clasificarse en monovalentes o polivalentes. Un

CIENCIAS ECONOMICAS 8vo. CICLO 9

Un identificador de una entidad es un atributo o conjunto de atributos que

1. No pueden existir dos ocurrencias de la entidad con el mismo valor del

Toda entidad tiene al menos un identificador y puede tener varios

Una entidad E es una generalización de un grupo de entidades E , E , ... E ,

Cada jerarquía es total o parcial, y exclusiva o superpuesta. Una jerarquía es

CIENCIAS ECONOMICAS 8vo. CICLO 10

Un subconjunto es un caso particular de generalización con una sola entidad

3.8 Metodología de diseño conceptual

El primer paso en el diseño de una base de datos es la producción del