Está en la página 1de 17

OBJETIVOS DE DISEÑO DE ARCHIVOS O BASES DE DATOS

El almacenamiento de datos es considerado por algunos como la parte


medular de los sistemas de información. Los objetivos generales para el
diseño de la organización son los siguientes.

 INTEGRIDAD DE LOS DATOS


 DISPONIBIBILIDAD DE DATOS
 ACTUALIZACION Y RECUPERACION EFICIENTE
 ALMACENAMIENTOS DE DATOS EFICIENTE
 RECUPERACION DE INFORMACION PARA UN PROPOSITO

ARCHIVOS CONVENCIONALES Y BASES DE DATOS

Hay dos enfoques para el almacenamiento de datos en un sistema basado


en computadora. El primer método es guardar los datos en archivos
individuales, cada uno de ellos único para una aplicación particular. La
figura 1 ilustra una organización con varios sistemas de información que
usan archivos convencionales separados: ARCHIVOS DE VENTAS, que
contiene información histórica de ventas, ACTIVIDAD ACTUAL, que es
actualizado frecuentemente y ARCHIVO PERSONAL, que contiene
direcciones, títulos, etcétera.

Observe que NUM y NOMBRE existe en cada archivo. Aparte del esfuerzo
adicional para teclear tres veces el nombre, un cambio del nombre
requerirá la actualización de tres archivos separados.

El segundo enfoque para el almacenamiento de datos en un sistema


basado en computadora involucra la construcción de una base de datos.
Una base de datos formalmente definido y centralmente controlado para
ser usado en muchas aplicaciones diferentes. La figura 2 muestra que
diferentes usuarios de diferentes departamentos dentro de la organización
pueden compartir la misma base de datos, tal como se muestra en el juego
de datos 1, o determinados renglones en el juego de datos 2.

 
Fig. 1 Ejemplo de organización con archivos convencionales

El juego de datos 3 contiene columnas seleccionadas y el juego de datos 4


usa algunos renglones para calcular totales. Estos juegos de datos son
translapantes, indicando que los datos que fueron redundantes en archivos
convencionales están guardados solamente

Fig. 2 Ejemplo de un sistema de base de datos


Archivos Convencionales

Sin lugar a dudas, los archivos convencionales seguirán siendo una forma
práctica para guardar datos para algunas aplicaciones (pero no para todas).
Un archivo puede ser diseñado y construido muy rápidamente, y las
preocupaciones sobre disponibilidad y seguridad de los datos son
minimizados Cuando los diseños están cuidadosamente pensados se
puede incluir toda la información necesaria, y el riesgo de omitir datos
intencionalmente será mas bajo.

Cuando ya existen aplicaciones existentes con archivos tradicionales y el


tiempo de desarrollo es una consideración importante, la solución es
limitar el alcance del proyecto y diseñar otro archivo para la nueva
aplicación.

La velocidad de procesamiento es una ventaja del uso de archivos. Es


posible escoger la técnica óptima para el procesamiento para una sola
aplicación, pero es imposible el diseño óptimo para muchas tareas
diferentes. Así si la velocidad de procesamiento es la mayor preocupación
es recomendable diseñar un archivo individual para este propósito

Un sistema que usa archivos convencionales implica que los datos


guardados serán redundantes. Lo que es mas, la actualización de archivos
se hace más tiempo. La integridad de los datos es una preocupación,
debido a que un cambio de un archivo también requerirá modificaciones a
los mismos datos en otros archivos.

BASES DE DATOS

Una base datos es una fuente central de datos que está pensada para que
sea compartida por muchos usuarios con una diversidad de aplicaciones.

Los objetivos de efectividad de la base datos incluyen:

Asegurarse de que la base de datos puede ser compartida entre los


usuarios de una diversidad de aplicaciones.

Mantener datos que sean precisos y consistentes.

Asegurarse de que todos los datos requeridos para las aplicaciones


actuales y futuras estén fácilmente disponibles.

Permitir que la base de datos evolucione y que las necesidades de los


usuarios crezcan.

Permitir que los usuarios construyan su vista personal de los dardos sin
preocuparse de la forma en que estén físicamente guardados los datos.

La lista anterior de objetivos nos proporciona un recordatorio de las


ventajas y desventajas, del enfoque de base de datos.

Ventajas de las bases de datos.

Integridad de los datos, debido a que los cambios en los datos se logran
muchos más fácil y confiablemente si los datos aparecen una sola vez

Los datos tienen una oportunidad de estar disponibles que en un sistema


de archivos tradicionales.

Una base de datos puede evolucionar conforme cambian las necesidades


de los usuarios y las aplicaciones
Desventajas de las bases de datos

Todos los datos están guardados en un solo lugar. Por lo tanto, son mas
vulnerable a catástrofes y requieren respaldos completos.

Existen riesgos de que el administrador de la base de datos sea el único


privilegiado y con capacidades suficiente para acercarse y controlar los
datos.

Los procedimientos para modificar la base de datos pueden hacerse


burocráticos y lentos, por la idea de mantener la seguridad de la
información.

Otras desventajas cuando se trata de lograr dos objetivos de eficiencia para


la administración del recurso de datos son los siguientes:

Mantener en una cantidad tolerable el tiempo para insertar, actualizar,


borrar y recuperar datos. Debido a que los datos son compartidos por
muchos usuarios y aplicaciones.

Mantener en una cantidad razonable el costo de almacenamiento de los


datos. Por el costo de la tecnología y personal requerido.

ENTIDADES

Cualquier objeto o evento acerca del cual alguien escoge recolectar datos
es una entidad. Una entidad puede ser una persona, lugar o cosa, por
ejemplo, un vendedor, una ciudad o un producto. Cualquier entidad
también puede ser un evento o una unidad de tiempo, tal como la
descompostura de una maquina, una venta o un mes o año.

RELACIONES

Las relaciones son asociaciones entre entidades (a veces son llamadas


asociaciones de datos). La figura 3 es un diagrama entidad-relación que
muestra diversos tipos de relaciones.
El primer tipo de relación es la relación uno a uno (indicada como 1:1). El
diagrama muestra que hay solamente un PAQUETE DE PRODUCTO para
cada EMPLEADO tiene una OFICINA única. Observe que todas estas
entidades pueden ser descritas adicionalmente (un PRECIO DE PRODUCTO
no sería una entidad y tampoco lo sería una extensión telefónica).

El segundo tipo de relación es la asociación de uno a muchos (1:M). Tal


como se muestra en la figura, un MEDICO es una organización para el
cuidado de la salud tiene asignado muchos PACIENTES, pero un PACIENTE
está asignado a solamente un MEDICO. Otro ejemplo, muestra que un
EMPLEADO es miembro de un solo DEPARTAMENTO, pero cada
DEPARTAMENTO tiene muchos EMPLEADO(s)

Por último, una relación muchos a muchos (indicada como M:N) describe la
posibilidad de que las entidades tengan muchas asociaciones en cualquier
dirección. Por ejemplo, un ESTUDIANTE puede tener muchos CURSOS Y, al
mismo tiempo, un CURSO puede tener muchos ESTUDIANTES inscritos en
él. El segundo ejemplo muestra que un VENDEDOR puede atender muchas
CIUDADES, y una CIUDAD puede ser un área de ventas para muchos
vendedores.

Fig. 3 Ejemplo de un diagrama Entidad-Relación


ATRIBUTOS

Un atributo es alguna característica de una entidad. Puede haber muchos


atributos para cada entidad. Por ejemplo, un paciente (entidad) puede tener
muchos atributos, tales como apellido, nombre, calle, ciudad, estado, etc.
La fecha de la última visita del paciente, así como los detalles de la receta,
también son atributos.

REGISTROS

Un registro es un conjunto de conceptos de datos que tienen algo en


común con la entidad descrita. La figura 4 es una ilustración de un registro
con muchos conceptos de datos relacionados. El registro que se muestra
es para un pedido colocado con una compañía de ventas por correo. EL
#PEDIDO, APELLIDO, INICIAL, CALLE, CIUDAD, ESTADO Y TARJETA DE
CREDITO son atributos. La mayoría de los registros son de longitud fija y,
por lo tanto, no hay necesidad de determinar la longitud del registro cada
vez.

Fig. 4 Ejemplo de un Registro.

LLAVES

Una llave es uno de los conceptos de datos de un registro que se usa para
identificar un registro. Cuando una llave identifica en forma única a un
registro es llamada la llave primaria. Por ejemplo, #PEDIDO puede ser una
llave primaria debido a que solamente un numero es asignado a cada
pedido de cliente. De esta forma, la llave primaria identifica a la entidad del
mundo real (pedido del cliente).

Una llave es llamada llave secundaria si no puede identificar en forma única


a un registro. las llaves secundarias pueden usarse para seleccionar un
grupo de registros que pertenecen a un conjunto.
METADATOS

Los metadatos son datos acerca de los datos del archivo o base de datos.
Los metadatos describen el nombre dado y la longitud asignada a cada
concepto de datos. Los metadatos también describen la longitud y
composición de cada uno de los registros. La figura 5 es un ejemplo de
metadatos de una base de datos.

Fig. 5 Ejemplo de metadatos de una base de datos.

UN EJEMPLO DE ENTIDAD- RELACION

En la figura 6 se muestra un diagrama de entidad - relación que contiene


muchas entidades, muchos tipos diferentes de relaciones y varios
atributos.

Fig. 6 Ejemplo de un diagrama entidad – relación.


TIPOS DE ARCHIVOS

Los archivos pueden ser usados para guardar datos durante un periodo
indefinido de tiempo o pueden ser usados para guardar datos
temporalmente para un propósito específico. Los tipos de archivos son:
Archivos Maestros y los Archivos de Tablas que son usados para guardar
datos durante un periodo largo, Archivos Temporales son llamados por lo
general: Archivos de Transacciones, Archivos de Trabajo o Archivos de
Reporte.

Archivos Maestros

Los archivos maestros contienen registros de un grupo de entidades. Los


atributos pueden ser cambiados frecuentemente, pero los registros son
relativamente permanentes. Estos tienden a tener grandes registros que
contienen toda la información acerca de una entidad de datos. Cada
registro contiene, por lo general, una llave primaria y varias llaves
secundarias. Frecuentemente estos archivos son guardados como archivos
indexados o archivos secuenciales con índices. Ejemplos de archivos
maestros incluyen registros de pacientes, registros de clientes, un archivo
de personal o un archivo de inventario de partes.

Archivos de tablas

Estos archivos contienen datos usados para calcular mas datos o medidas
de desempeño. Por ejemplo una tabla de tarifas postales para determinar
el costo del envío de un paquete, Una tabla de impuesto, etc. Estos tipos
de archivos por lo regular son leídos por un solo programa.

Archivos de transacciones Estos archivos se usan para capturar cambios


que actualizan los archivos maestros y para producir reportes. Por ejemplo
un archivo maestro de suscriptores de periódicos, puede tener un archivo
de transacción que contengan el código y nombre del suscriptor, código de
la transacción, tal como E, para extender la suscripción, C para cancelarla o
D para cambio de dirección. Así se necesita solo dar la información
relevante cuando se requiera. Por lo cual los archivos de transacciones son
mantenidos por lo general, a una longitud mínima. Además estos pueden
contener varios tipos de registros diferentes.

Archivos de trabajo

Los programas puede ejecutarse mas eficientemente si se usan archivos


trabajo. Un ejemplo de archivos de trabajo es aquel que ha sido
reordenado para que los registros puedan ser accesados más rápidamente.

Archivos de reporte

Cuando es necesario ejecutar un programa que imprima información y no


existe la impresora o esta ocupada, se usa un archivo de reporte. El enviar
la salida a un archivo es vez de a una impresora es llamado spooling,
posteriormente cuando el dispositivo este listo se puede imprimir la
información del archivo de reporte.

ORGANIZACIÓN SECUENCIAL
Cuando los registros están físicamente en orden en un archivo se dice que
es un archivo secuencial. Cuando se actualizan estos archivos es necesario
recorrer todo el archivo. Debido a que los registros no pueden ser
insertados en las partes medias, por lo general el archivo es copiado en el
proceso de actualización. En la fig.7 se muestra un ejemplo de archivo
secuencial.

Fig. 7 Ejemplo de un archivo secuencial

ORGANIZACION INDEXADA

Un índice es diferente de un apuntador debido a que es guardado en un


archivo aparte del archivo de datos. La figura 8 muestra que se han
generado cuatro archivos de índices separados del ARCHIVO DE PEDIDOS
de discos compactos.

Fig. 8 Ejemplo de Archivos Índices


ORGANIZACION SECUENCIAL INDEXADA

Un método de organización ampliamente usado es llamado organización


secuencia indexada o ISAM (por método de acceso secuencial indexado). Es
un archivo ISAM los registros están colocados en bloques. Los registros
dentro de los bloques están guardados en orden físicamente, pero los
bloques de registros pueden estar en cualquier orden. Por lo tanto, se
necesita un índice para localizar los bloques de registros. Estos tipos de
archivos permiten que los programas lean, borren o reescriben registros
directamente sin leer otros registros del archivo. Además son colocados en
secuencia dentro del archivo.

ESTRUCTURA DE DATOS EN RED

Una estructura de red permite a cualquier entidad tener cantidad de


subordinados o de superiores. En la figura 9 se muestra una estructura de
red.
Fig. 9 Estructura de base de datos red

ESTRUCTURA DE DATOS RELACIONAL

Una estructura de dato relaciona consiste en una o más tablas de dos


dimensiones a las que se le llama relaciones. Los renglones de la tabla
representan los registros y las columnas contienen atributos.

En la figura 10 se muestra el ordenamiento de la base de datos para discos


compactos como una estructura relaciona.

NORMALIZACION

La normalización es la transformación de vistas de usuario complejas y


almacenes de datos de estructuras de datos estables más pequeñas.
Además de ser más simples y más estables, las estructuras de datos
normalizadas son más fáciles de mantener.

Fig. 10 Estructura de base de datos relacional.


Los tres pasos de normalización

La primera etapa del proceso incluye la eliminación de todos los grupos


repetidos y la identificación de la llave primaria. Para hacer esto, la relación
necesita ser dividida en dos o mas relaciones.

El segundo paso asegura que todos los atributos que no son llaves sean
completamente dependientes de la llave primaria. Todas las dependencias
parciales son eliminadas y puestas en otra relación. Así se hace lo
siguiente:

El tercer paso elimina cualquier dependencia transitiva. Una dependencia


transitiva es aquella en la cual atributos que no son llaves son
dependientes de otros atributos que no son llaves. Así se hace lo siguiente.

 EJEMPLO DE SEGUNDA FORMA NORMAL


Si se tiene la siguiente relación. Para convertir la relación a segunda forma
normal se divide la relación en dos de la manera siguiente:

 EJEMPLO DE TERCERA FORMA NORMAL

Si se tiene la siguiente relación: Designado los empleados que estarán a su


cargo. Si todos los empleados abandonarán el proyecto se eliminarían
todos los registros que contienen la información de la fecha de
terminación. Para resolver estos problemas la relación se divide de la
manera siguiente:

 LINEAMIENTOS PARA EL DISEÑO DE RELACIONES DE ARCHIVO/BASE DE


DATOS

Cada entidad de datos separada debe crear un archivo maestro. No


combine dos entidades distintas en un solo archivo. Por ejemplo, los
artículos son comprados de vendedores. EL ARCHIVO MAESTRO DE
ARTICULOS debe contener solo información de artículos, y el ARCHIVO
MAESTRO DE VENDEDORES solo debe contener información de vendedores.

Un campo de datos específico debe existir solamente en un archivo


maestro. Por ejemplo el NOMBRE DE CLIENTE debe existir solo en el
ARCHIVO MAESTRO DE CLIENTES. Las excepciones a esto son los campos
claves o de índice que pueden estar en tantos archivos como sea necesario.
Si un reporte o pantalla necesita información de muchos archivos, los
índices deben proveer el enlace para obtener los registros requeridos.

Cada archivo maestro o relación de base de datos deben tener programas


para Crear, Leer, Actualizar y Borrar registros.

PASOS EN LA RECUPERACION Y PRESENTACIÓN DE DATOS

Existen ocho (8) pasos en la recuperación y presentación de datos:

 Escoja una relación de la base de datos.


 Una dos relaciones
 Proyecte columnas para la relación
 Seleccione renglones de la relación
 Derive nuevos atributos
 Indexe u ordene renglones
 Calcule totales y medidas de desempeño.
 Presente datos.

Los paso primero y último son obligatorios, pero los seis entre ellos son
opcionales, dependiendo de la forma en que van a ser usados los datos. La
fig. 11 es una guía visual de los pasos antes nombrados. A continuación se
describen brevemente cada paso.

 Fig. 11 Guía Visual de los pasos de Recuperación y Presentación de


Información en una  base de datos.