Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Metropolitano
Administración de Archivos
Ingeniería en Tecnologías de la Información
Cuarto Cuatrimestre
1
UNIDAD I.- DISPOSITIVO DE ALMACENAMIENTO EXTERNO
2
TAMBOR MAGNETICOS
Características
El tambor magnético es un cilindro de metal hueco o sólido que gira en una
velocidad constante (de 600 a 6.000 revoluciones por minuto), cubierto con un
material magnético de óxido de hierro sobre el cual se almacenan los datos y
programas. A diferencia de los paquetes de discos, el tambor magnético
físicamente no puede ser quitado. El tambor queda permanentemente montado
en el dispositivo. Los tambores magnéticos son capaces de recoger datos
a mayores velocidades que una cinta o una unidad de disco, pero no son
capaces de almacenar más datos que aquellas.
Algunos tambores son montados en posición horizontal, mientras que hay otros
que son montados en posición vertical.
DISCO MAGNETICO
Un disco magnético (flexible o duro) sirve como soporte de almacenamiento para
archivos de información. Almacena los bytes de estos archivos en uno o varios
sectores de pistas circulares.
Pistas circulares
Las pistas circulares son anillos concéntricos separados lo menos posible entre sí,
existentes en sus dos caras recubiertas de una fina capa superficial de material
magnetizable. Este es del tipo usado en las cintas de audio, siendo que
las partícula ferro magnética que lo componen conservan su magnetismo aunque
desaparezca el campo que las magnetizó.
El cuerpo del disco así recubierto en sus dos caras, está constituido: en
los disquetes por mylard(flexible), y en los discos rígidos por aluminio o cristal
cerámico.
4
La grabación se logra como en un grabador de audio por la acción de un campo
magnético depolaridad reversible (N-S ó S-N), que imanta la pista al actuar dicho
campo sobre ella, al salir a través de un corte (“entrehierro”) realizado en un
diminuto núcleo ferro magnético (núcleo hoy suplantado por una película
delgada inductiva).El ancho de este núcleo determina del ancho de la pista (0,1
mm o menos).
Un disquete o disco flexible (en inglés floppy disk o diskette) es un medio o soporte
de almacenamiento de datos formado por una pieza circular de material
magnético, fina y flexible (de ahí su denominación) encerrada en una cubierta
de plástico cuadrada o rectangular.
Los disquetes (cuyo nombre fue escogido para ser similar a la palabra “casete“),
gozaron de una gran popularidad en las décadas de los ochenta y los noventa,
usándose en ordenadores domésticos y personales tales
como Apple II, Macintosh, MSX 2/2+/Turbo R, Amstrad PCW, Amstrad CPC
664 yAmstrad CPC 6128 (y opcionalmente Amstrad CPC 464), ZX Spectrum
+3, Commodore 64, Amiga eIBM PC para distribuir software, almacenar
información de forma rápida y eficaz, transferir datos entre ordenadores y crear
pequeñas copias de seguridad, entre otros usos. Muchos almacenaban de forma
permanente el núcleo de sus sistemas operativos en memorias ROM, pero
guardaban sus sistemas operativos en un disquete, como ocurría con CP/M o,
posteriormente, con DOS.
Un disquete de 5,25″.
5
También fue usado en la industria de los videojuegos, cuando Nintendo hizo un
formato propio de disquete, parecido al actual de 3 1/2, para usar con un
periférico diseñado para la consola Famicomllamado Famicom Disk Drive. No
obstante, sólo se lanzo en Japón. También se vendían disquetes en blanco, para
grabar juegos en la calle, mediante máquinas automáticas instaladas en algunos
lugares de Japón.
Con la llegada de la década de los noventa, el aumento del tamaño del software
hizo que muchos programas se distribuyeran en conjuntos de disquetes. Hacia
mediados de los noventa, la distribución del software fue migrando gradualmente
hacia el CD-ROM, y se introdujeron formatos de copias de seguridad de mayor
densidad, como los discos Zip de Iomega. Asimismo, en grandes, medianas e
incluso pequeñas empresas, las copias de seguridad empezaron a efectuarse de
manera sistemática en cintas magnéticasde alta capacidad y muy bajo coste,
como cintas de audio digitales (DAT) o streamers. Con la llegada del acceso total
a la Internet, de las redes Ethernet baratas y de las memorias flash ó USB de bajo
costo, los disquetes han dejado ser necesarios para la transferencia rápida de
datos.
DISCO DURO
Un disco duro (del inglés hard disk (HD)) es un disco magnético en el que puedes
almacenar datos de ordenador. El disco duro es la parte de tu ordenador que
contiene la información electrónica y donde se almacenan todos los programas
(software). Es uno de los componentes del hardware más importantes dentro de tu
PC.
El término duro se utiliza para diferenciarlo del disco flexible o disquete (floppy en
inglés). Los discos duros pueden almacenar muchos más datos y son más rápidos
que los disquetes. Por ejemplo, un disco duro puede llegar a almacenar más de
100 gigabytes, mientras que la mayoría de los disquetes tienen una memoria
máxima de 1.4 megabytes.
Los discos duros externos son discos duros que se conectan externamente al
ordenador, normalmente mediante USB, por lo que son más fáciles de transportar.
6
¿Qué es un Hard Disk Drive o HDD?
Un hard disk drive (HDD) es el mecanismo que lee y escribe datos en un disco
duro. Los hard disk drives (HDDs) para PC generalmente tienen tiempos de
búsqueda de unos 12 milisegundos o menos aunque muchos mejoran su
funcionamiento con una técnica llamada caching.
Hay varios estándares de interfaz para pasar datos entre un disco duro y un
ordenador, los más comunes son el IDE y el SCSI.
La Memoria
La memoria es uno de los componentes fundamentales de las computadoras, sin
ellos no tendrían un medio de almacenamiento temporario para la ejecución de
Programas. La memoria es el medio de almacenamiento temporal en el que la
CPU (Microprocesador) puede escribir, leer o modificar información.
Tipos de Memorias:
A) RAM (Random Access Memory = Memoria de Acceso al Azar o Aleatorio): Es la
Memoria Principal de la Computadora.
A) Memoria RAM
7
Memoria Principal o Memoria RAM
En principio la memoria de CPU eran de 1, 4, 16, 32, 48, 64 Kb, después hasta 640
Kb y luego cifras más grandes. Pero ahora existe la memoria convencional,
extendida, expandida o LIM, más allá de la ROM. Se de debe a la mala
planeación. No se pensó que se llegase a necesitar más de 640 Kb. Las memorias
son de alta velocidad – de 1 s para leer o escribir. No confundir la RAM con la
memoria secundaria que es lo almacenado en disco rígido, cuya demora es
mayor a 100000 veces en el acceso (más de 1 ms (milisegundo) en responder).
Memoria Convencional o Base: son los primero 640 KB utilizados por el Sistema
Operativo para cargar su parte fija en memoria, sus controladores, los programas
residentes. Almacena y ejecuta Programas. Está dividida en 10 bloques de 64 KB
cada uno, donde se alojan
el COMMAND.COM, IO.SYS, MSDOS.SYS,AUTOEXEC.BAT, CONFIG.SYS, DBLSPACE.BI
N.TSR (Terminate and Stay Resident) (15Kb). Son los programas que se cargan y
permanecen en memoria, por ejemplo antivirus, doskey, sidekick, controladores o
drivers. Las aplicaciones tienen disponibles 178 Kb. La memoria está constituida
en bancos de chips (ej., 2 bancos de 256Kb + 2 bancos de 64Kb) (ej., en AT 286, 4
bancos de 256 Kb = 1024 Kb) No obstante los 1024 Kb, la memoria convencional
sigue siendo de 640Kb (la que utiliza fácilmente DOS), el resto será memoria
extendida o expandida.
Memoria Expandida: desarrollada por Lotus, Intel y Microsoft en el año 1985 para
placas y controladores de Memoria Expandida. Se denominó LIM – EMS (
Lotus Intel Microsoft – Expanded Memory Specification ) que maneja hasta 4 MB
de Memoria Expandida paginando de a 64 KB en Memoria Superior ( tomando 64
8
KB de la Memoria Superior – bloque comprendido entre los 640 KB y los 1.024 KB – )
para utilizarlos como 4 Páginas de 16 KB cada uno, que corresponden a otras
direcciones más altas. Sus emuladores son: QEMM386, 386MAX y EMM386 (con
Windows 3.1 o D.O.S. 5.0). Memoria EMS, LIM, paginada, expandida Los 640Kb que
dos permite son insuficientes y la Memoria Extendida es prácticamente inútil con
dos. Las hojas de cálculo tienen que tener todos sus datos en memoria al mismo
tiempo, por lo que un archivo con 2 MB, resulta imposible de cargar en
DOS. Lotus, Intel y Microsoft desarrollaron un software, el LIM, para que un
producto pueda omitir las limitaciones de DOS, a través de paginar la memoria
(pueden administrar hasta 32Mb de memoria paginada). Se manejan 4 páginas
de 16Kb a la vez, de memoria expandida, en el área de 640 a 1024Kb. Se trata de
ir trayendo páginas de 16Kb de memoria expandida al área reservada
(denominándose también a este sector: marco de página y al pasaje de
datos). El paginado toma tiempo así que el acceso a memoria convencional es
más rápido que a memoria expandida. Productos de software actuales como el
EMM386 permiten configurar la memoria extendida como expandida, es decir,
hacen simular la extendida como expandida para poder correr programas que
utilizaban bajo DOS esta modalidad.
Memoria Extendida: va más allá del Primer Megabyte (1.024 KB a 4.096 KB) de
memoria, puede ser direccionada por procesadores 80286 o superiores. Trabaja
en modo protegido (un área o zona de memoria NO puede ser utilizada por otro
programa). Utiliza el controlador HIMEM.SYS que divide a la Memoria Extendida en
dos: 64 KB para HMA (High Memory Área) y la otra en Memoria
Extendida XMS(extended Memory Specification) el estándar desarrollado por
Lotus, Intel y Microsoft. Los Sistemas Operativos que utilizan esta modalidad son
Windows 3.x, Windows 95, 98, NT, OS/2 y Novell 386.
9
solo los diseñados para funcionar en modalidad protegida. OS/2 utiliza
originariamente modalidad protegida.
Memoria Alta (HMA = High Memory Aérea): se encuentra entre los 1.024 KB y los
1.088 KB, permitiendo cargar de un programa a la vez. Se utiliza para cargar la
parte residente del D.O.S. y algunos controladores, liberando Memoria
Convencional.
La ROM BIOS: se puede leer datos, pero no se puede escribir nuevos, ni modificar
los existentes. Este tipo de memoria se encuentra pregrabada por el fabricante y
contiene instrucciones sobre el manejo de algunas tarjetas o las operaciones
principales de la PC. Este tipo de ROM se llama BIOS (Basic Input Output System =
Sistema Básico de Entrada Salida).
Es el traductor de los llamados del Sistema Operativo a los dispositivos de Entrada
Salida. Se ubica en los últimos 64 KB de Memoria Reservada o Superior. Los Chips
BIOS poseen 24 o 28 patas.
Memoria CACHE: memoria ultra rápida que agiliza los procesos. Cuando los
procesadores comenzaron a tener velocidades de reloj cada vez mayores, y
funcionaban más y más rápido, los tiempos de acceso de memoria
RAM dinámica no alcanzaba para seguirle el ritmo. La solución sería utilizar
memorias con menores tiempos de acceso: las RAM Estáticas (son más costosas
que las memorias RAM Dinámicas). Las memorias de tipo Estática, acumulan las
cargas en un grupo de seis transistores, que conforman celdas, esta integración
provoca la pérdida de la alta densidad de almacenamiento de estas, debido a
esto se incrementa el volumen de las celdas y por lo tanto de los chips de
memoria, además la integración de este tipo de elementos a esta escala es
costosa, por lo tanto no se utiliza como memoria principal, sino como memoria
Cache , o sea una memoria intermedia entre el procesador y la memoria
RAM. Ejemplo de utilización de la memoria Cache: el microprocesador procesa
una página de un documento, en la Cache Externa se almacenan las páginas 2,3
y 4 (que presupone va a utilizar). Cuando el Micro necesita alguna de esta
páginas, busca primero en la memoria Cache Externa y si no la encuentra, la
busca en la Memoria RAM. El tiempo de acceso es de 4 Nanosegundos. Las
Memorias Cache pueden ser Externa e Interna. En las 386, eran Externas
solamente (está conectada a través de un bus). A partir de las 486 aparece la
Cache Interna.
10
UNIDAD II. DEFINICIONES DE ARCHIVOS
2.1. Campo, Campo secuencia, Registro llave de archivo, Base de datos, Transaccion,
Organización de registro y Archivos.
Tipos de Campo
Un campo puede ser:
Campo genérico
Aquel campo que posee un dato único para una repetición de entidad. Puede
servir para la búsqueda de una entidad en específico.
CAMPO SECUENCIAL
Es la forma básica de organizar un conjunto de registros, que forman un archivo,
utilizando una organización secuencial. En un archivo organizado
secuencialmente, lo registros quedan grabados consecutivamente cuando el
archivo se utiliza como entrada.
11
En la mayoría de los casos, los registros de un archivo secuencial quedan
ordenados de acuerdo con el valor de algún campo de cada registro. Semejante
archivo se dice que es un archivo ordenado; el campo, o los campos, cuyo valor
se utiliza para determinar el ordenamiento es conocido como la llave del
ordenamiento.
Un archivo puede ordenarse ascendente o descendentemente con base en su
llave de ordenamiento.
Las formas en las cuales pueden organizarse los archivos, son archivos
secuénciales o archivos directos.
LLAVE DE REGISTRO
La llave de cambio registro es una llave del clarinete que se emplea para tocar en
el segundo registro; es decir, aumenta la altura de la mayoría de las notas del
primer registro en un intervalo de doceava (19semitonos) cuando se pulsa. Se sitúa
encima del agujero del pulgar izquierdo y maneja con el pulgar izquierdo. La
misma llave se usa en combinación con la llave del primer dedo izquierdo que
produce la nota escrita la4 que suena si♭4. Algunos clarinetistas,
particularmente clarinetes bajos y más graves, tienen llaves separadas, o unos
sistemas de llaves más complejo, para controlar dos o tres agujeros separados
para tocar el si♭, para tocar las notas inferiores del segundo registro, y para tocar
las notas superiores del segundo registro. La llave de octava que realiza la misma
función en oboes y saxofones, eleva la altura en un intervalo de octava.
BASE DE DATOS
12
Una base de datos o banco de datos (en ocasiones abreviada con la sigla BD o
con la abreviatura b. d.) es un conjunto de datos pertenecientes a un mismo
contexto y almacenados sistemáticamente para su posterior uso. En este sentido,
una biblioteca puede considerarse una base de datos compuesta en su mayoría
por documentos y textos impresos en papel e indexados para su consulta.
Actualmente, y debido al desarrollo tecnológico de campos como
la informática y la electrónica, la mayoría de las bases de datos están en formato
digital (electrónico), que ofrece un amplio rango de soluciones al problema de
almacenar datos.
Aunque las bases de datos pueden contener muchos tipos de datos, algunos de
ellos se encuentran protegidos por las leyes de varios países. Por ejemplo, en
España los datos personales se encuentran protegidos por la Ley Orgánica de
Protección de Datos de Carácter Personal (LOPD).
TRANSACCION
Una transacción es una interacción con una estructura de datos compleja,
compuesta por varios procesos que se han de aplicar uno después del otro. La
transacción debe realizarse de una sola vez y sin que la estructure a medio
manipular pueda ser alcanzada por el resto del sistema hasta que se hayan
finalizado todos sus procesos.
13
La transferencia de fondos entre dos cuentas corrientes de un banco. Si queremos
transferir, supongamos 5000€ de la cuenta corriente de A y B y las cuentas tienen,
respectivamente, 20000€ y 0€ de saldo los pasos lógicos serían:
Este ejemplo ilustra por qué las transacciones tienen un comportamiento deseado
de Todo o nada, o se realiza completamente o no debe tener ningún efecto.
Propiedades
Las transacciones deben cumplir cuatro propiedades ACID:
ARCHIVO SECUENCIAL
Los archivos secuenciales son un tipo de archivo en los que la información puede
leerse y escribirse empezando desde el principio del archivo.
2. Para leer una zona concreta del archivo hay que avanzar siempre, si la zona
está antes de la zona actual de lectura, será necesario “rebobinar” el archivo.
3. Los ficheros sólo se pueden abrir para lectura o para escritura, nunca de los dos
modos a la vez.
15
En la mayoría de los casos, los registros de un archivo secuencial quedan
ordenados de acuerdo con el valor de algún campo de cada registro. Semejante
archivo se dice que es un archivo ordenado; el campo, o los campos, cuyo valor
se utiliza para determinar el ordenamiento es conocido como la llave del
ordenamiento.
Con el fin de proporcionar una secuencia para los registros, se define una llave
para cada uno. Uno o más atributos se volverán los atributos llave para los registros
en los archivos. El conjunto de valores para los atributos llave generalmente
identifica el objeto descrito por el registro; es decir, el número de placa de un
automóvil el nombre de une persona. Se espera poder identificar los registros en
forma única con base en sus llaves.
16
puede identificarse atributos llave secundarios o inferiores hasta que el orden se
determine por completo.
La lectura serial del archivo en este orden puede realizarse ahora en forma
secuencial. Algunas veces se agregan campos artificiales conteniendo números
de secuencia o identificación, para obtener atributos llave únicos. La
participación del archivo, analizada con la descripción de archivo de apilo ahora
se realiza de forma explícita: se selecciona el número de identificación para que
sea único para todos los registros y parta al archivo en n registros individuales.
Ventajas y Desventajas
Otra ventaja de los archivos de organización secuencial es que son muy sencillos
de usar y aplicar.
17
Los elementos fundamentales para el buen desempeño de archivos secuenciales
son: el factor de bloqueo, la longitud del archivo (afectado por el diseño del
registro) y la elección de la llave. Los archivos de organización secuencial son
sencillos y pueden ser almacenados en un medio económico.
Son muy adecuados para las aplicaciones que requieren sólo acceso secuencial
a los datos contenidos. No son adecuados para aplicaciones que requieren
acceso directo a algunos registros particulares de la colección. No proporcionan
apoyo para aplicaciones interactivas. No obstante, continuarán siendo
importantes.
Ejemplos de Aplicaciones:
18
Consiste en que los archivos están organizados secuencialmente; sin embargo, es
posible acceder directamente a los registros. La organización secuencial-
indexada de un archivo brinda facilidades para acceder a los registros de ambas
formas, secuencial y directamente. Los registros se almacenan en la secuencia
física usual por la clave primaria. Además, se almacena en el disco el índice de la
localización del registro. Esto permite el acceso secuencial a los registros para
aquellas aplicaciones que realicen una gran cantidad de actualizaciones y, por
otra parte, el acceso directo de acuerdo con las solicitudes de los usuarios.
· Tiempo transcurrido
· Tamaño del área de desborde (entre 25 y 30% del tamaño del archivo principal)
19
MANTENIMIENTO DE UNA ARCHIVO
* Consulta de Datos
* Cierre de un Fichero
* Inserción de Datos
* Borrado de un Fichero
20
Cada registro en un archivo de organización directa hace referencia por un
número entero de dirección, el cual indica su distancia o desplazamiento desde el
origen del archivo. Al primer registro en un archivo relativo se le asigna el valor 1, 2
al siguiente y así sucesivamente. De este modo, la dirección relativa de un valor
entero que refleja su posición respecto al primer registro del archivo. El acceso
aleatorio de un registro en un archivo de organización relativa se hace vía su
número relativo de registro.
Pues esta forma nos permite acceder de forma directa dando másfunciones,
probablemente rapidez en la búsqueda de datos.
Los archivos relativos son archivos que pueden ser accesados directamente por
medio de llaves que a través de un método son convertidas en direcciones en las
que se almacenan los registros.
El uso de esta función genera lo que se llama colisiones. Las colisiones son las
repeticiones de direcciones que se obtienen de la función HASH. Conforme más
saturado se ve un archivo más frecuentes serán las colisiones que se presenten. El
factor de carga nos dice que tan lleno esta un archivo y que tan bueno es el
desempeño del archivo, el factor de carga se obtiene dividiendo él número de
registros en el archivo sobre él número máximo de registros que puede almacenar
el archivo.
21
5.3. La Estructura de Árboles para Multiniveles
Existen diversas formas de generar el número final a partir del número “grande”,
las más utilizadas son:
22
Método del centro de los cuadrados. Consiste en obtener el cuadrado del número
“grande”; del valor resultante se rescatan los dígitos centrales tantos como se
requieran para direccionar el esqueleto y se multiplican por un factor de ajuste
para colocar el resultado en el rango deseado.
Método del desplazamiento. En este caso se consideran los dígitos más externos
del número “grande”. De cada extremo se toman tantos dígitos como se
requieran para el direccionamiento. Estos se suman y se aplica un factor de ajuste.
Método del plegado. Es similar al anterior salvo que los dígitos de los extremos se
suman en forma encontrada, semejando que el número total se encontrara
escrito en una hoja y esta fuera doblada por la mitad.
Método del análisis de dígitos. Se obtiene una muestra de gran tamaño de llaves
posibles y sus números hash correspondientes, se analiza la frecuencia de
repetición para cada una de las columnas y se van descartando aquellos que
presentan mayor repetición. Finalmente, se toman las columnas con mayor
variación y tantas como dígitos se requieren. Se aplica factor de ajuste. Una vez
que se ha determinado la dirección hash por cualquiera de los métodos
anteriores, se implementara sobre una estructura que soporte tal
direccionamiento.
La memoria virtual es una técnica que permite ejecutar procesos que no caben
totalmente en memoria RAM (memoria física). Esto propicia la creación de
programas que sean más grandes que la memoria física. Además, la memoria
virtual ayuda a crear un esquema de abstracción de la memoria que la separa de
la zona lógica que el usuario ve, esto facilita enormemente la tarea a los
programadores puesto que no se han de preocupar por limitaciones de memoria.
23
sólo hay cargada aquella zona de código y datos que se necesitan en ese
instante de tiempo, y no el programa completo. La memoria virtual es la
separación entre la memoria lógica disponible para el usuario y la memoria RAM,
se implementa generalmente con el método de paginación por demanda
aunque también se puede implementar en un sistema con segmentación.
24
UNIDAD VIII. ACCESO MULTILLAVES
25
UNIDAD IX. EVALUACION GENERAL DE SISMETA DE ARCHIVO
Los beneficios del sistema de archivos es muy amplio, y ofrece una gran
utilización una gran ayuda a los usuarios.
26
· Asignación contigua: Cada directorio contiene la los nombres de archivos y la
dirección del bloque inicial de cada archivo, así como el tamaño total de los
mismos.
· Asignación encadenada: Con este criterio los directorios contienen los nombres
de archivos y por cada uno de ellos la dirección del bloque inicial que compone
al archivo. Cuando un archivo es leído, el brazo va a esa dirección inicial y
encuentra los datos iniciales junto con la dirección del siguiente bloque y así
sucesivamente. Con este criterio no es necesario que los bloques estén contiguos
y no existe la fragmentación externa, pero en cada “eslabón” de la cadena se
desperdicia espacio con las direcciones mismas. En otras palabras, lo que se crea
en el disco es una lista ligada.
27
ACCESO DIRECTO: Permite acceder a cualquier sector o registro inmediatamente,
por medio de llamadas al sistema como la de seek. Este tipo de acceso es rápido
y se usa comúnmente en discos duros y discos o archivos manejados en memoria
de acceso aleatorio.
ACCESO DIRECTO INDEXADO: Este tipo de acceso es útil para grandes volúmenes
de información o datos. Consiste en que cada archivo tiene una tabla de
apuntadores, donde cada apuntador va a la dirección de un bloque de índices,
lo cual permite que el archivo se expanda a través de un espacio enorme.
Consume una cantidad importante de recursos en las tablas de índices pero es
muy rápido
28