Está en la página 1de 9

ARCHIVOS Y ALMACENAMIENTO DE DATOS EN COMPUTADORAS Definicin de archivos y tecnologa de almacenamiento Archivo es un conjunto de datos de computadora relacionados completo y con

nombre, que est en un medio de almacenamiento, tal como un programa, un conjunto de datos utilizado por un programa, o un documento creado por el usuario. Un archivo es la unidad bsica de almacenamiento que habilita a una computadora para distinguir un conjunto de informacin relacionada de otro. Un archivo es el pegamento que liga un conglomerado de instrucciones, nmeros, palabras o imgenes en una unidad coherente que un usuario puede recuperar, cambiar, borrar, guardar o enviar a un dispositivo de salida. Hay varios tipos de archivos, tales como: Archivos de Datos, Archivos Fuente, Archivos Ejecutables, Archivos en Lote. Archivos de Datos: contienen palabras, nmeros y figuras que pueden ser visualizados, editados, grabados, enviados e impresos. Son creados por las Aplicaciones; por ejemplo como documentos creados con un procesador de texto, o cuando se graba una figura, grfica, sonido o video. Habitualmente, los archivos de datos se visualizan, revisan e imprimen por medio del mismo software en el que se les cre. Archivos fuente: contienen instrucciones comprensibles para el usuario, pero que no pueden ser ejecutadas directamente por la computadora. Reciben tambin el nombre de Programas Fuente, ya que deben ser traducidos a formato ejecutable por la computadora, mediante un Programa Traductor (Compilador o Ensamblador). Archivos ejecutables: Son archivos en disco que contienen la parte ejecutable de un programa de computacin. Dependiendo de su tamao y complejidad, una aplicacin o cualquier otro programa, tal como un sistema operativo, se puede almacenar en varios archivos distintos, cada uno de los cuales contendr las instrucciones necesarias para ejecutar ciertas partes del funcionamiento global del programa. Archivo en Lote o Batch File: Es un archivo ASCII que contiene una secuencia de rdenes del sistema operativo, posiblemente incluyendo parmetros y operadores admitidos por el Lenguaje de Comandos por Lotes. Al introducir el usuario un nombre de archivo en la lnea de comandos, se procesan las rdenes secuencialmente.

Tecnologa De Almacenamiento Para controlar los cientos o miles de archivos almacenados en disco y dispositivos de almacenamiento, la computadora cuenta con un sistema de archivo o almacenamiento a cargo del sistema operativo. Existen dos conceptos importantes relacionados con los archivos: Almacenamiento Lgico: el cual es un modelo conceptual del modo en que se almacenan los datos en el disco. Este modelo mental cmodo que ayuda al usuario a comprender el sistema de almacenamiento de la computadora. Almacenamiento Fsico: ndica cmo es el almacenamiento en el disco fsico. Tecnologa de Almacenamiento: se refiere a un dispositivo de almacenamiento y los medios fsicos que utiliza. Medio de Almacenamiento: es el disco, cinta, papel u otro medio que contiene los Archivos de Datos. Dispositivo de Almacenamiento: es el aparato mecnico, como una unidad de disco, que registra y recupera los datos que hay en el medio de almacenamiento. La mayora de las computadoras tiene ms de un dispositivo de almacenamiento que usa el SO para guardar los archivos. Cada dispositivo se identifica con una letra y dos puntos. Las unidades suelen ser A: y B: en tanto que el disco duro es C: Si hay ms dispositivos, se les asignan letras de la D a la Z. Escribir Datos o Guardar un Archivo es el proceso de grabar los datos en el medio de almacenamiento para tenerlos disponibles cuando se usen (Por ejemplo, guardar el archivo en disco duro). Abrir un Archivo: es el proceso de tener disponibles los datos para recuperarlos ( leerlos o cargarlos) cuando se necesiten en el programa que se est ejecutando. Capacidad de Almacenamiento: es la mxima cantidad de datos que se pueden guardar en un medio. Los datos se guardan como bytes (8 bits); cada byte representa un carcter. Los datos se miden en kilobytes (KB), que son 1024 bytes; megabytes (MB), alrededor de 1 milln de bytes, gigabytes (GB) cerca de mil millones de bytes. Por ejemplo, la frase desarrollo endgeno requiere 19 bytes de almacenamiento porque contiene 19 caracteres (incluido el espacio en blanco entre palabras).

Estudio del almacenamiento en disquetes, cds y dvds Disquete es un disco de plstico mylar flexible, cubierto con una delgada capa de xido magntico. La cantidad de datos que puede almacenar una computadora en cada cara de un disquete depende del tipo del mismo, su densidad y formateo. El proceso de formateo (ya visto en la Unidad I) crea una serie de pistas concntricas, y cada pista se divide en segmentos ms pequeos, llamados sectores. Cada sector tiene numeracin sucesiva, de manera que un disquete de dos caras se formatea con 80 pistas por cara y 18 sectores por pista; esto es 1440 sectores. En las PC compatibles cada sector de una pista puede contener 512 bytes de datos; por consiguiente, un archivo de 512 bytes o menos cabe en un sector. Los archivos ms grandes ocupan ms sectores. El uso ms frecuente de los disquetes es en tres aplicaciones: como medio de distribucin, como almacenamiento de datos, y como respaldo off line de archivos importantes para el usuario. Acceso aleatorio: es la posibilidad que tiene un dispositivo de almacenamiento en disco de ir, directamente, a cualquier lugar del medio de almacenamiento para grabar o leer datos. La cabeza de lectura y escritura puede leer o escribir datos en cualquier sector y en cualquier orden. Adems del almacenamiento magntico existe el Almacenamiento ptico. En ste los datos se queman con rayo lser en el medio de almacenamiento, los Discos Compactos o CD-ROM, son los que ms se usan en el almacenamiento ptico. La tecnologa CD-ROM (de Compact Disk Read Only Memory: memoria slo lectura en disco compacto) se deriva del sistema de grabacin de audio digital en disco compacto. Un CD-ROM para computadora, contiene datos grabados en la superficie en forma de una serie de huecos en una superficie reflejante. Los CD-ROM aceptan hasta 680 megabytes cada uno y son muy durables. La superficie del disco est recubierta de plstico transparente, por lo cual los datos son permanentes e inalterables. Disco de Video Digital (DVD) es un medio ptico de alta velocidad capaz de almacenar una pelcula completa en un CD. A diferencia del disco compacto normal, que almacena

datos en un solo lado. Un disco con formato DVD almacena datos en ambos lados. Con la tecnologa de discos de video digital, el video, el sonido y los datos de computadora pueden codificarse en un disco compacto (CD). Los DVD pueden ser de doble cara con una capacidad de almacenamiento de 17 GB por disco. Estudio del almacenamiento en discos duros El almacenamiento en disco duro permite un acceso ms rpido que en una unidad de disquete o en una de Zip, y es el medio preferido en la mayor parte de los sistemas de computacin. Tambin se denomina Hard Disk o Disco Duro. Un plato de disco duro es un disco plano y rgido, hecho de aluminio o vidrio recubierto con xido magntico. Un Disco Duro est formado por uno o ms platos con sus respectivas cabezas de lectura y escritura (un mecanismo tipo dientes de tenedor). Tienen caractersticas fsicas de platos de 3.5 pulgadas de dimetro montados sobre un eje, formando una Pila de Discos. Igual que el disquete de mylar, pero con capacidad mayor y velocidad de acceso es bastante menor. Los discos modernos giran en el orden de las 7500 rpm (revoluciones por minuto). Los discos duros se encuentran en movimiento continuo. Son de acceso aleatorio a los archivos, colocando la cabeza de lectura y escritura sobre el sector que contiene los datos solicitados. Los discos duros pueden ser fijos o desmontables y su tecnologa est en constante evolucin. Cach de Memoria para el Disco Duro: para aumentar la velocidad de acceso a los datos, la computadora podra usar un cach de disco (o reserva de memoria RAM) el cual se utiliza para mantener informacin que o bien ha sido solicitada recientemente desde el disco o ha sido escrita previamente en el disco. Si la informacin requerida permanece en el cach de disco, el tiempo de acceso es considerablemente ms rpido que si el programa de computadora tuviera que esperar a que el mecanismo del dispositivo del disco busque la informacin fsicamente en el disco.

Estudio del almacenamiento en cinta magntica Cinta Magntica (magnetic tape) Es una tira delgada de pelcula delgada de polister cubierto con material magntico que permite la grabacin de datos. Ya que la cinta es una longitud continua de material de almacenamiento de datos y puesto que la cabeza de lectura/escritura no puede saltar a un punto deseado en la cinta sin que la cinta avance primero a ese punto, la cinta debe leerse o escribirse secuencialmente, no aleatoriamente (como puede hacerse en un disquete o en disco duro). Resulta un medio de almacenamiento con un tiempo de acceso muy lento, pero son mucho ms baratas que los discos duros, por eso se les utiliza fundamentalmente para grabar en ellas copias de respaldo o backup de la data que contienen los archivos claves grabados en disco duro. Estudio del almacenamiento fsico de datos El almacenamiento fsico de archivos se realiza en grupos o clusters. Los cuales son un conjunto de sectores tratados como grupo para efectos de lectura o grabacin, por ser la unidad de almacenamiento ms pequea accesible para una computadora. La cantidad de sectores (segmentos de almacenamiento en el disco) que utiliza el Sistema Operativo (SO) para leer o escribir informacin; normalmente un clster est formado por dos a ocho sectores, cada uno de los cuales mantiene un cierto nmero de bytes (caracteres). Cuando la computadora almacena un archivo en un disco, el SO registra el nmero del grupo que contiene el inicio del archivo en una Tabla de Asignacin de Archivos (o FAT file allocation table). La FAT es un archivo del SO que permite a la computadora almacenar y recuperar archivos del disco mediante una lista de los archivos y su ubicacin fsica en el disco. Si se daa la FAT se pierde la posibilidad de acceso normal a los archivos fsicos que contiene el disco duro.

Para ilustrar el concepto de FAT veamos el siguiente cuadro: Cmo trabaja la FAT (Tabla de asignacin de archivos en el disco) Grupo Estado Comentario 1 1 Reservado para el Sistema Operativo 2 1 Reservado para el Sistema Operativo 3 4 Primer clster de un archivo llamado Bio.txt. Apunta al grupo 4 4 5 6 7 8 9 10 999 0 0 8 10 999 999 donde hay ms datos de este archivo. ltimo clster del archivo Bio.txt Vaco Vaco Primer clster de un archivo llamado Jordan.wks. Apunta al grupo 8, que contiene ms datos del archivo Jordan.wks Apunta al clster 10 que contiene ms datos del archivo Jordan.wks Primero y ltimo grupo del archivo Picks.wps ltimo grupo del archivo Jordan.wks

Cada sector aparece en la FAT con un nmero que indica el estado del grupo o clster. Si el Estado es 1, el grupo se reserva para archivos tcnicos. Si es 0, el grupo est vaco y entonces puede almacenar datos. Si es 999, el grupo contiene el final de un archivo. Los dems nmeros de estado indican el sector dnde contina el archivo de datos. El lugar de la FAT correspondiente al grupo 7, se ve que el archivo Jordan.wks sigue en el grupo o clster 8. En el lugar de la FAT correspondiente al grupo 8, se observa que el archivo Jordan.wks contina en el grupo 10. La entrada FAT para el grupo 10 indica que es la parte final del archivo Jordan.wks (Este archivo est almacenado en los grupos no contiguos 7, 8 y 10. Por lo tanto, es un archivo fragmentado. Cuando va a almacenar un archivo: el SO busca en la FAT para determinar cules clsters o grupos estn vacos. A continuacin, registra los datos del archivo en esos grupos. Los nmeros de los grupos quedan registrados en la FAT, y el nombre del nuevo archivo, ms el nmero del primer grupo que contiene sus datos, se graban en el directorio. Un archivo que no cabe en un solo grupo se distribuye en el siguiente grupo contiguo, a menos que ste tenga datos. Si est lleno, el SO los almacena en grupos no adyacentes y

establece instrucciones llamadas apuntadores (pointers). Estas instrucciones apuntan a cada parte del archivo. Al recuperar un archivo, el SO busca en el directorio su nombre y el nmero del primer grupo que contiene sus datos. La FAT dice a la computadora qu grupos contienen el resto de los datos del archivo. El SO mueve la cabeza de Lectura/Escritura del Disco correspondiente al grupo con el inicio del archivo y lo lee. Si ocupa ms de un grupo, la cabeza de lectura/escritura pasa al grupo siguiente para seguir leyendo, y as sucesivamente. Se tarda ms en acceder al archivo almacenado en grupos no adyacentes porque la cabeza lectora/grabadora del disco se debe desplazar ms hasta encontrar la siguiente seccin del archivo. Archivo fragmentado es aquel que se encuentra almacenado en muchos grupos no adyacentes, consecuencia del almacenamiento aleatorio. Esto afecta el rendimiento general del acceso a la data en el disco duro. Para organizar el archivo o archivos fragmentados para que queden grabados en grupos consecutivos, se utiliza una utilera de desfragmentacin o reintegracin de archivos con lo cual se optimiza el tiempo de acceso a los archivos en el disco. Compresin de datos o de archivos es una tcnica que reduce el tamao de un archivo grande al usar menos bits para representar en el disco los datos que contiene. PKZIP es una utilera que crea archivos comprimidos con la extensin .zip No es posible usar directamente un archivo comprimido; hay que descomprimirlo con la utilera PKUNZIP. La compresin de archivos es reversible mediante la descompresin, extraccin o expansin de stos para que los datos vuelvan a su forma original. La compresin es una forma cmoda de archivar, respaldar o transmitir archivos.

Aprendizaje de la administracin de archivos El almacenamiento lgico de archivos, que es el modo conceptual en que los datos se almacenan en el disco. Nombre de Archivo es un conjunto exclusivo de letras y nmeros que identifica el archivo y, usualmente describe su contenido, cuando se aplica la

nemotecnia. Un nombre vlido de archivo se forma apegndose a reglas especficas o convenciones de nomenclatura de archivos. Cada SO tiene un conjunto nico de convenciones. Un nombre de archivo tiene dos partes: nombre (8 hasta 256 caracteres), un separador de punto (.) y una extensin (3 caracteres) dependiendo de la Aplicacin donde se crea el archivo. Algunas extensiones importantes: .exe Archivo de programa ejecutable .com Archivo ejecutable .sys Archivo del sistema operativo .txt Archivo de texto .wav Archivo de sonido .doc Archivo de documento .xls Archivo de hoja de clculo .bmp Archivo de grfico .avi Archivo de animacin .mdb Archivo de base de datos .ppt Archivo de presentaciones Estudio del almacenamiento lgico de archivos Adems de conocer las convenciones de nomenclatura de archivos es importante saber cmo se almacenan los archivos en el disco. Las alegoras de estructuras de directorios se llaman modelos lgicos porque representan la forma lgica como se les concibe. Por ejemplo, el directorio de un disco puede visualizarse mentalmente como un rbol, donde: el Disco Duro C:\ (Es la raz), el tronco y las ramas son directorios, y las hojas son archivos. Otra forma de Representacin es como una Jerarqua. rbol de Directorio Jerrquico del Disco Duro en Unidad C:

Uso de los archivos en el entorno cotidiano de los estudiantes Como parte de su proceso de formacin, los estudiantes de esta Unidad Curricular (Introduccin a la Informtica) debern familiarizarse con Archivos de Procesadores de Palabra (.doc y .txt), Archivos de Hojas de Clculo (.xls), Archivos de Presentaciones (.ppt), Archivos de Bases de Datos (.db), Archivos de Grficos y de imgenes (.mbp, cgi, jpg, etc), Archivos de sonido (.wav), Archivos ejecutables (.exe, .com), entre otros. Adems, de la amplia gama de archivos que se encuentran en la WWW. Investigacin de usos contemporneos de los archivos y bases de datos Como parte de su formacin en los Programas Nacionales de Formacin que ofrece Misin Sucre, los estudiantes deben familiarizarse con la Navegacin en Internet para realizar investigaciones. Igualmente, deben elaborar documentos de texto con Procesadores de Palabras para efectos de Monografas, Informes, Proyectos Socio Comunitarios, etc., trabajar con Hojas de Clculo para todo lo que tenga que ver con Clculos y Cuadros Estadsticos. Realizar diversos tipos de presentaciones computarizadas; consultas a bases de datos, etc.