Está en la página 1de 7

Los archivos tambin denominados ficheros (file); es una coleccin de informacin (datos relacionados entre s), localizada o almacenada

como una unidad en alguna parte de la computadora. Los archivos son el conjunto organizado de informaciones del mismo tipo, que pueden utilizarse en un mismo tratamiento; como soporte material de estas informaciones.

Los archivos como coleccin de datos, sirve para la entrada y salida y son manejados con programas. Su estructura base esta compuesta por campos (columnas) y registros (filas). Los campos son aquellos aspectos relevantes (datos) que tienen validez para el uso del archivo y componen un registro lgico; y Un registro es la estructura de datos integrada por los campos que identifican una ocurrencia del objeto (alumno, cliente, producto). Cada archivo es referenciado por su identificador (su nombre).

Las principales estructura son:

caractersticas

de

esta

Independencia de la informacin respecto de los programas; La informacin almacenada es permanente; Un archivo puede ser accedido por distintos programas en distintos momentos; Gran capacidad de almacenamiento.

La clasificacin mas general que podemos realizar es: Archivos Binarios: Integrados por informacin digital De imagen: .jpg, .gif, .tiff, .bmp (Portable bitmap), .wmf (Windows Meta File), .png (Portable Network Graphics), .pcx (Paintbrush); entre muchos otros De video: .mpg, .mov, .avi, .gif Comprimidos o empaquetados: .zip, .Z, .gz, .tar, .lhz Ejecutables o compilados: .exe, .com, .cgi, .o, .a Procesadores de palabras: .do Archivos ASCII: Su contenido son datos (nombre, edad, sexo, valor), que ser utilizada por programas que Archivos fuente: .f, .c, .p Formatos de texto: .tex, .txt, .html Formatos de intercambio: .rtf, .ps, .uu
1/4

Dentro de los archivos ASCII de uso comn por los programas de bioinformtica estn los siguientes: De secuencias: .seq De secuencias mltiples: .aln, .msf (Multiple Sequence Format) De secuencias alineadas: .rsf (Rich Sequence Format), estos archivos pueden incluir una o ms secuencias relacionadas o no. Todos estos archivos se caracterizan por tener ciertos formatos distintivos, que hacen posible su reconocimiento por parte de los programas de manipulacin y anlisis de secuencias como el PHYLIP, el GCG; entre muchos otros. Otra clasificacin general es la de: Archivos de programa: Contienen instrucciones en un lenguaje de programacin; y Archivos de datos: Lo componen valores que alimentarn los procesos realizados por archivos de programa.
2/4

Los archivos se clasifican segn su uso en tres grupos: Permanentes o Maestros: Estos contienen informacin que varia poco. En algunos casos es preciso actualizarlos peridicamente. De Movimientos o Transacciones: Se usan para actualizar los archivos maestros. Sus registros son de tres tipos: alta, bajas y modificaciones.

De Maniobra, Trabajo o Intermedios : Tienen una vida limitada, normalmente menor que la duracin de la ejecucin de un programa. Su utilizan como auxiliares de los anteriores.
3/4

Los archivos se clasifican segn sus elementos en:


Archivo de Entrada : una coleccin de datos localizada en un dispositivo de entrada. Archivo de Salida : una coleccin de informacin visualizada por la computadora. Archivo de Programa : un programa codificado en un lenguaje especifico y localizado o almacenado en un dispositivo de almacenamiento. Archivo de Texto : una coleccin de caracteres almacenados como una unidad en un dispositivo de almacenamiento.
4/4

Corresponde al mtodo utilizado para acceder a los registros de un archivo, independiente de su organizacin. Existen distintas formas de acceder a los datos:

Secuencial : Los registros se leen desde el inicio hasta el final del archivo, de tal forma que para leer un registro se deben leer todos los anteriores. Directo : Cada registro puede leerse / escribirse de forma directa solo con expresar su direccin en el archivo por l numero relativo del registro o por transformaciones de la clave de registro en l numero relativo del registro a acceder.

Por ndice : Se accede indirectamente a los registros por su clave, mediante consultas secuenciales a una tabla que contiene la clave y la direccin relativa de cada registro, y posterior acceso directo al registro.
Dinmico; es cuando se accede a los archivos en cualquier de los modos anteriormente citados.

La eleccin del mtodo esta directamente relacionado con la estructura de los registros del archivo y del soporte utilizado (cinta, disco).

Las operaciones generales que se realizan son: Creacin: Escritura de todos sus registros. Consulta: Lectura de todos sus registros. Actualizacin: Insercin, supresin o modificacin de algunos de sus registros Clasificacin: Reubicacin de los registros de tal forma que queden ordenados segn determinado(s) criterio(s). Borrado: Eliminacin total del archivo, dejando libre el espacio que ocupaba en el soporte.
7

Los archivos se encuentran organizados lgicamente como una secuencia de registros de varias longitudes diferentes.

Los archivos de registros de longitud fija: son los que almacenan la informacin en los archivos mediante un encabezado y luego se introducen uno a uno los registros ubicados en posiciones consecutivas. Los registros de longitud variable: es el almacenamiento de registros de varios tipos en un archivo y permite uno o ms campos de longitudes variables y dichos campos pueden ser repetidos. La longitud de los registros debe estar definida correctamente para poder leer y escribir de forma efectiva.

La organizacin de archivos, corresponde a la estructura lgica de los registros, determinada por la manera en que se accede a ellos. La organizacin fsica del archivo en almacenamiento secundario depende de la estrategia de agrupacin y de la estrategia de asignacin de archivos.

Para seleccionar una organizacin de archivos hay diversos criterios que son importantes:

Acceso Rpido para recuperar la informacin Fcil actualizacin Economa de almacenamiento Mantenimiento simple. Fiabilidad para asegurar la confianza de los datos.

También podría gustarte