Está en la página 1de 13

ORGANIZACIN DE DATOS

2012

UNIDAD III

UNIDAD III

3. Archivo secuencial indexado INTRODUCCIN En los computadores ms modernos, los archivos siempre ubican un nombre y se ubican en un directorio. Cada nombre debe ser nico en cada directorio, ya que este solamente acepta una sola ruta y no puede haber dos archivos con el mismo nombre. La identificacin del archivo es la ruta y su nombre. Todas la computadoras estructuran los archivos en jerarquas llamadas carpetas, directorios o catlogos. Cuando la en la computadora se usa una carpeta, esta tiene su nombre de identificacin y su ruta de especificacin. Cuando los archivos secunciales indexados tienen una limitacin este se basa en el registro del archivo, de acuerdo al campo que se le haya asignado. Cuando se requiere de la busca de un registro y este no es especificado de acuerdo al nombre de la clave que se le haya determinado, por lo tanto la bsqueda terminara sin arrojar ningn resultado verdico ya que es imposible buscar dicha ruta con otra especificacin. Por lo general los archivos son utilizados en aplicaciones en donde pocas veces se tiene la oportunidad de hacer una bsqueda o revisin completa de la informacin. Dichos datos se dice que son flexibles cuando la estructura que utiliza

tiene varios ndices, en donde cada uno de ellos es aplicado a cada campo de cada registro.

3.1 Estructura Archivos Organizacion Secuencial Indexado Este tipo de organizacin se utiliza cuando existe la necesidad tanto de acceder a los registros secuencialmente, por algn valor de llave, como de acceder los individualmente. Un archivo secuencial indexado puede tener acceso porque manejan un archivo secuencial y un archivo relativo o de acceso directo. El tipo de sus registros contiene un campo clave identificador. Los registros estn situados en un soporte direccionable por el orden de los valores indicados por la clave. Un archivo secuencial indexado contiene un archivo ndice y un archivo de datos. Es necesario que los registros contengan un campo clave para identificarlos y que estn almacenados en un soporte direccionable segn el orden que indique dicha clave. El archivo ndice agilizar la bsqueda dentro del fichero. El fichero de datos se organiza, lgicamente, en bloques o pginas de varios registros. . Cada registro del fichero ndice almacena: El valor del campo clave del ltimo registro de un bloque. Los bloques estn constituidos por un nmero fijo de registros consecutivos.

La direccin del primer registro de dicho bloque. Puede haber un rea de desbordamiento. Ocupa ms espacio en disco pero es ms rpido. Puede almacenarse el fichero ndice en memoria. Habra que calcularlo al iniciar una sesin de trabajo. En este tipo de organizacin de archivos se dispone de una tabla en que aparecen ordenados secuencialmente los nmeros de la clave del archivo y asociados a cada uno de ellos de da la direccin del registro correspondiente. AREAS DEL ARCHIVO SECUENCIAL INDEXADO rea de Datos: Contiene los registros secuencial, esta ordenados alfabticamente o alfanumricamente y no deja espacios. rea de ndice: Los niveles de ndice estn contenidos en una tabla, si existieran varios ndices enlazados se denomina nivel de indexacin rea de Desbordamiento o Excedentes: Esta rea es utilizada para realizar actualizaciones si ello es necesario FICHEROS CON ORGANIZACIN SECUENCIAL INDEXADA. Un archivo con organizacin secuencial indexada est formado por: AREA DE DATOS: Es el rea en la que se escriben los registros cuando el archivo es creado el en directorio del fichero. Los fichero con organizacin secuencial indexada se graban en un soporte de almacenamiento directo, en secuencia ascendente, de acuerdo con los valores de la clave y en pginas o bloques de longitud fija.

El AREA DE INDICES: es creada por el sistema al mismo tiempo que se van almacenando los datos. Contiene una tabla que asocia las claves con las direcciones de los registros en el rea de datos. Cada entrada del rea de ndices est formada por el valor ms alto de la clave de cada grupo de registros y un puntero con la direccin del primer registro del grupo. los registros que no tienen sitio en el rea de datos. Los nuevos registros se insertan y quedan enlazados entre s mediante punteros conservando el orden lgico que marca la clave o ndice principal.Un AREA DE EXCEDENTES: donde se graban Del tratamiento de los ndices y punteros se encarga el sistema operativo por lo que no va a crear problemas al usuario cuando maneja este tipo de ficheros. El usuario sabe lo que sucede cuando solicita una consulta de un registro, pero no sabe como se realiza internamente esa consulta.

3.2 Representacion de Indices Representacin de indices El campo clave-secundaria sobre el cual se crea un indice se llama clave inversa o clave indexada. Se dice entonces que el campo es inverso para la recuperacion por clave secundaria. La figura muestra un archivo de estudiantes y sus indices asociados: un indice valor clave y un nombre clave. Las dos claves inversa son CLASS y AGE. Cada entrada del indice valor clave

consiste en un valor de clave secundaria y en un conjunto de sealadadores a los registros de datos. Un sealador puede contener en una direccion relativa, una direccion fisica o una clave principal de los registros objetos. DIRECCION RELATIVA El campo sealador en el indice valor clave de la fig. contiene direcciones relativas. Para ejemplificar, la primera entrada del indice indica que los registros uno, cuatro y cinco contienen el valor clave 541 en el campo CLASS. SEALADOR SIMBOLICO Un sealador simbolico es un identificador de regsitros, pero no una direccion de registro. Por ejemplo, un valor de clave primaria puede usarse como sealador simbolico porque identifica de manera unica a un registro del archivo. Si se escoge al sealador simbolico como identificador de registro, la primera entrada del indice en el indice valor clave de la fig contendria: Valor de clave secundaria sealador de registro 541 150,164,172 los valores 150, 164 y 172 son los valores de las claves primarias (S-ID) de los registros 1,4 y 5, respectivamente. Estos valores de clave-primaria pueden traducirse a su direccion de registro correspondiente por medio de distribucion o busqueda de indice (Hashing) dependiendo de la organizacin basica de archivo subyacente, es decir, directa o secuencial indexada. DIRECCION FISICA El campo sealador puede contener direcciones fisicas, las cuales pueden usarse para accesar registros directamente sin necesidad de traducir la direccion, como fue necesario en los casos 1) y 2). Sin embargo, la mayor desventaja del uso de las direcciones reales, es que los valores del sealador dependen entonces del

dispositivo. Por ejemplo, hay que recrear un indice si los datos del archivo emigran de un disco a otro. Cada entrada en el indice nombre clave en la fig. consiste en un nombre clave-inversa y un sealador hacia la primera entrada del indice valorclave. Los distintos indices en una organizacin inversa juntos forman un directorio. como responde un sistema inverso de archivos a las consultas sobre las claves secundarias? Considerese la siguiente consulta en el archivo inverso de la fig. listar los nombres de los estudiantes cuya edad sea 21 aos. Puede responder rapidamente buscando en el directorio de la manera siguiente: empezar la busqueda con el indice nombre-clave para localizar la entrada AGE. Analizar el indice valor-clave para encontrar el valor 21 en la clave secundaria. Recuperar los registros objetivo del archivo de datos en las direcciones relativas 3y 7. Se dice que se tiene un indice denso cuando este incluye cada valor clave posible en un conjunto indexado. El indice valor- clave de la fig. es denso porque todos los valores de las claves inversas estan incluidos en el indice. Por ejemplo, los tres numeros posibles de CLASS en el archivo de datos son 541, 542, y 543. Los tres aparecen en el indice valor-clave. Se dice que una clave inversa esta parcialmente indexada si solo algunos de sus valores claves estan incluidos en el indice valor-clave. Los valores clave que estan indexados son aquellos usados en la condiciones de busqueda. Un indice parcialmente indexado se llama indice disperso. Para un indice con una gran cantidad de elementos, la busqueda secuencial sobre el indice no es muy eficiente. Por esto, un indice se organiza

generalmente como una estructura de varios niveles como es el caso de la estructura multinivel de indice principal para los archivos secuenciales indexados. El directorio para el archivo de datos de la fig. esta organizado como un indice de nivel dos, en el cual el indice nombre-clave se crea para facilitar la busqueda en el indice valor-clave. El grado de inversion se refiere al nivel de totalidad de inversion expresada por el numero de campos y lo extenso de los valores de los campos invertidos. Una inversion de 0% significa que no se invirtio ningun campo clave en un registro. Por otro lado, un archivo con el 100% de inversion tiene invertido cada valor clave de cada campo de datos. En algunos sistemas operativos macromainframe se dispone de elementos para invertir indices automaticos si se declaran las claves secundarias en un programa, por ejemplo. VSAM de IBM y AAM de Cyber, son capaces de crear indices inversos sobre la organizacin secuencial indexada y directa. MANEJO DE INDICES Cada vez que se inserta, borra o actualiza un registro, las entradas afectadas de un indice deben ser modificadas por el sistema para que asi, el indice pueda proporcionar las trayectorias de datos correctas.

3.3 Operaciones sobre Archivo Secuencial ARCHIVOS SECUENCIALES

Existen ademas muchas operaciones asociadas a archivos, las mas elementales son: 1.- Creacin de Archivo.- En este proceso se pretende solamente crear un archivo nuevo en disco, con su nombre, tipo y especialidad de almacenamiento de datos apropiado. 2.- Apertura de Archivos.- En este caso se pretende abrir un archivo ya existente en disco para procesarlo, ya sea cargar o grabar datos en sus registros, o leer algun registro en especial para mandarlo a una variable de cualquier tipo. No confundir creacin con apertura, creacin es un proceso que solo se ejecuta una sola vez en la vida de un archivo, mientras que apertura, siempre se esta realizando por los programas especializados en algun proceso. 3.-Cierre de archivos: Es la operacin mas importante en cualquier programa que maneje archivos, o se cierra el archivo como ultima instruccin del pograma o se vera el anuncio ABORT,RETRY,FAIL. 98, /s, scandisk 4.-Altas en archivo.- En este proceso se carga una clase en memoria con sus datos pertinentes y se graba la clase en el archivo en disco. 5.-Lectura de archivo.- En este proceso, se abre el archivo y se manda el registro de disco, a una clase en memoria para su procesamiento.

6.- Consulta de archivos: En este proceso se pretende desplegar todos los registros del archivo en disco a la pantalla, ya sea consola o mejor an, a una pagina html 7.-Busqueda en archivos: Una de las operaciones mas comunes, consiste en que el usuario pide toda la informacin de algun renglon en disco, porporcionando la informacin de algun campo, generalmente el campo clave de la clase. 8.- Filtros.- En este proceso el usuario esta interesado en algun conjunto de renglones con caracteristicas comunes (condicin), por ejemplo todos los alumnos de sisJAVA TEMA s, o todos los empleados que ganen mas de $500.00 pesos, o todos los clientes que sean de tijuana, etc 9.-Modificaciones de registros o archivos: Problema muy comun, donde los datos originales ya grabados se tienen que cambiar o actualizar, por ejemplo el nombre no era juan es juana, o la calificacin no es 100 es 20, etc. 10.- Bajas de registros: tambien muy comun este proceso,por ejemplo el alumno ya egreso, el cliente huyo, etc.

3.4 Operaciones sobre Archivo Secuencial Indexado Los archivos secuenciales son utilizados en aplicaciones de proceso de lotes y son ptimos para dichas aplicaciones si se procesan todos los registros. La organizacin secuencial de archivos es la nica que es fcil de usar tanto en disco como en cinta. Para las aplicaciones interactivas que incluyen peticiones o

actualizaciones de registros individuales, los archivos secuenciales ofrecen un rendimiento pobre. Normalmente un archivo secuencial se almacena en bloques, en un orden secuencial simple de los registros. La organizacin fsica del archivo en una cinta o disco se corresponde exactamente con la ubicacin lgica del archivo. En este caso, el procedimiento para ubicar los nuevos registros en un archivo de pila separado, llamado archivo de registro o archivo de transacciones. Peridicamente, se realiza una actualizacin por lotes que mezcla el archivo de registro con el archivo maestro para producir un nuevo archivo en secuencia correcta de claves. Las operaciones que se realizan son: Creacin: Escritura de todos sus registros. Es la primera operacin que sufrir el archivo de datos. Implica la eleccin de un entorno descriptivo que permita un gil, rpido y eficaz tratamiento del archivo. Para utilizar un archivo, ste tiene que existir, es decir, las informaciones de este archivo tienen que haber sido almacenadas sobre un soporte y ser utilizables. La creacin exige organizacin, estructura, localizacin o reserva de espacio en el soporte de almacenamiento, transferencia del archivo del soporte antiguo al nuevo. Un archivo puede ser creado por primera vez en un soporte, proceder de otro previamente existente en el mismo o diferente soporte, ser el resultado de un clculo o ambas cosas a la vez. Consulta: Lectura de todos sus registros. Es la operacin que permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos los registros.

Actualizacin: Insercin supresin o modificacin de algunos de sus registros. Es la operacin que permite tener actualizado (puesto al da) el archivo, de tal modo que sea posible realizar las siguientes operaciones con sus registros: Consulta del contenido de un registro. Insercin de un registro nuevo en el archivo. Supresin de un registro existente. Modificacin de un registro. Clasificacin: Reubicacin de los registros de tal forma que queden ordenados segn determinados criterios. Una operacin muy importante en un archivo es la clasificacin u ordenacin. Esta clasificacin se realizar de acuerdo con el valor de un campo especfico, pudiendo ser ascendente (creciente) o descendente (decreciente): alfabtica o numrica. Borrado: Eliminando total del archivo, dejando libre el espacio del soporte que ocupaba. Es la operacin inversa a la creacin de un archivo (kill, en ingls). Cuando se destruye (anula o borra) un archivo, ste ya no se puede utilizar y, por consiguiente, no se podr acceder a ninguno de sus registros. Reorganizacin de un archivo: Las operaciones sobre archivos modifican la estructura inicial o la ptima de un archivo. Los ndices, enlaces (punteros), zonas de sinnimos, zonas de desbordamiento, etc., se modifican con el paso del tiempo, lo que hace a la operacin de acceso al registro cada vez ms lenta. La reorganizacin suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener una nueva estructura lo ms ptima posible.

Estallido de un archivo: Es la operacin de obtener varios archivos a partir de un mismo archivo inicial.

También podría gustarte