Está en la página 1de 25

1

UNIDAD 1
ALMACENAMIENTO DE
DATOS
2
1.1 Dispositivos de Almacenamiento
1.2 Discos Magnticos
1.3 Representacin de Datos
Temario
3
Memoria Cach
Memoria Principal
Discos Magnticos
Almacenamiento Terciario
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
4
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
Memoria Cach
Forma de almacenamiento ms rpida y costosa.
Tamao pequeo.
Responsabilidad del sistema operativo.
5
Memoria Principal
Memoria rpida, dirigida a satisfacer los pedidos de
la CPU.
Es el lugar de almacenamiento que se emplea para
los datos a procesar.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
6
Discos Magnticos
Usados, por lo general, para guardar datos a largo
plazo.
Su contenido debe trasladarse a la memoria
principal para su procesamiento. Luego, son
devueltos al disco de ser necesarios.
Son dispositivos de acceso aleatorio.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
2
7
Discos Magnticos: tres razones por las cuales es
necesario usarlo en lugar de la RAM.
Capacidad limitada de la RAM.
Memoria RAM ms cara.
Memoria RAM es voltil.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
8
Discos Magnticos: dos desventajas respecto de la
memoria principal
Necesita mucho ms tiempo para tener acceso a los
datos.
El costo de la recuperacin depende de donde
queden almacenados los datos dentro del dispositivo.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
9
Almacenamiento Terciario:
Engloba dispositivos que han sido diseados para
soportar grandes volmenes de datos, incluso del
orden de los terabytes.
Dichos dispositivos tienen tiempos de acceso
significativamente mayores, en comparacin a un
disco magntico.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
10
Almacenamiento Terciario: (cont.)
No obstante, tienen mayor capacidad de
almacenamiento y la relacin $/byte es menor.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
11
Almacenamiento Terciario: considera...
(Racks de) Discos pticos.
Cintas.
Silos de Cintas.
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
12
Dispositivos de Almacenamiento
Discos pticos
Racks de Discos pticos: dotados de un brazo que
se encarga de extraer un CD y moverlo al lector.
A la fecha, usados preferentemente para respaldos,
publicacin y difusin, ms que un medio de
almacenamiento de datos.
3
13
Dispositivos de Almacenamiento
Discos pticos
Organizacin Fsica:
Fabricado sobre un substrato de policarbonato,
recubierto por una lmina reflectante de aluminio, y
baado con una laca protectora.
Dimensiones:
120 milmetros de dimetro total
15 milmetros de dimetro del agujero central.
1,2 milmetros de grosor.
14
Dispositivos de Almacenamiento
Discos pticos
Organizacin Fsica:
El disco contiene una pista en espiral, igual que los
discos de audio, que empieza en el centro del disco y
termina en la parte exterior del mismo.
Esta pista tiene una anchura de unas 0,6 micras
(0,0000006 metros), estando separadas las vueltas
adyacentes 1,6 micras (0,0000016 metros).
15
Dispositivos de Almacenamiento
Discos pticos
Organizacin Fsica:
Lo anterior nos da una idea de la densidad del disco:
aproximadamente 6.300 pistas por centmetro.
Si se extendiese la pista en espiral a lo largo de una
lnea recta, la longitud total de la misma se
aproximara a los 5 km.
16
Dispositivos de Almacenamiento
Discos pticos
Almacenamiento de Datos:
Los datos se almacenan dentro la pista en espiral, la
cual tiene numerosos agujeros (hoyos, pits) en toda
su longitud.
Estos agujeros tienen una profundidad que pueden
alcanzar hasta 0,12 micras (0,00000012 metros) y 0,6
micras de anchura. Entre los agujeros existen zonas
planas llamadas tambin mesetas (pisos, lands).
17
Dispositivos de Almacenamiento
Discos pticos
18
Dispositivos de Almacenamiento
Discos pticos
Acceso a los Datos:
Cuando se lee la copia, se dirige un rayo lser sobre
la pista, mientras se mueve sobre el lente ptico.
Los agujeros dispersan la luz, pero los pisos reflejan
casi todo de vuelta al lente.
Este patrn alternante de intensidades altas y bajas,
de luz reflejada, es la seal para reconstruir la
informacin original.
4
19
Dispositivos de Almacenamiento
Discos pticos
20
Dispositivos de Almacenamiento
Discos pticos
Acceso a los Datos (continuacin):
El esquema de codificacin usado no es 1 para la
hendidura y 0 para un suelo .
En su lugar, los bits 1 son representados por las
transiciones hendidura-suelo y viceversa.
La cantidad de tiempo entre transiciones representa
el nmero de bits 0.
21
Dispositivos de Almacenamiento
Discos pticos
Acceso a los Datos (continuacin):
Con esta codificacin, no es posibles dos bits 1
adyacentes.debido a la resolucin del lente ptico,
debe haber dos valores 0 entre cualquier par de 1.
Esto significa que el patrn de valores 0 y 1 debe
ser traducido para conseguir los patrones de 8 bits del
byte original.
22
Dispositivos de Almacenamiento
Discos pticos
Acceso a los Datos (continuacin):
Lo anterior considera la utilizacin de una Tabla de
Codificacin EFM:
23
Dispositivos de Almacenamiento
Discos pticos
Acceso a los Datos (continuacin):
Disco Magntico: esquema de velocidad angular
constante (CAV) .
Disco Compacto: esquema de velocidad lineal
constante (CLV).
24
Dispositivos de Almacenamiento
Discos pticos
5
25
Dispositivos de Almacenamiento
Discos pticos
Organizacin fsica (continuacin):
Esquema CAV: desperdicia espacio de
almacenamiento en las pistas exteriores, pero permite
que el disco gire a la misma velocidad.
Esquema CLV: no entrega una forma adecuada para
llegar a una localizacin especfica, porque necesita
cambiar la velocidad de rotacin, pero aprovecha
mejor el espacio.
26
Dispositivos de Almacenamiento
Discos pticos
Capacidad de Almacenamiento:
La organizacin CLV no permite el tpico modo de
direccionamiento (cilindro, pista, sector).
En su lugar, cada segundo de reproduccin es
dividido en 75 sectores, cada uno de los cuales
guarda 2 KB de datos.
27
Dispositivos de Almacenamiento
Discos pticos
Capacidad de Almacenamiento: (cont.)
Luego, para un CD con 74 minutos de
reproduccin
74 minutos * 60 segundos/minuto * 75 sectores/segundo =
333.000 sectores
333.000 sectores * 2 KB/sector = 666.000 KB 650 MB
28
Dispositivos de Almacenamiento
Discos pticos
Estructura de un Sector:
La frecuencia de muestreo de un CD es de 44.1
kilohertz (44.100 veces por segundo).
As, se pueden registrar sonidos con frecuencias
que variarn hasta los 20 kilohertzel lmite superior
audible por el odo humano.
29
Dispositivos de Almacenamiento
Discos pticos
Estructura de un Sector:
Un muestreo como el anterior, unido a una
representacin de 16 bits, requiere almacenar 88.200
bytes por segundo.
Grabar sonido estreo significa duplicar la cantidad
anterior, subiendo a 176.400 bytes por segundo.
30
Dispositivos de Almacenamiento
Discos pticos
Estructura de un Sector:
Al dividir los 176.400 bytes por los 75 sectores por
segundo, se tienen 2.352 bytes por sectores, de los
cuales 2.048 bytes son de datos, y el resto:
Sincronizacin
ID Sector
Deteccin y Correccin de errores
Nulos
6
31
Dispositivos de Almacenamiento
Discos pticos
Velocidad de lectura:
Una unidad de velocidad simple (1X); 150 KB por
segundo.
Luego, una unidad de NX lee a (N * 150) KB por
segundo.
32
Dispositivos de Almacenamiento
Discos pticos
DVD
Digital Video (Versatile) Disc
Emplea un lser de lectura con una longitud de onda
de 650 nm (en el caso de los CDs, es de 780 nm)
La densidad de datos fsica real se incrementa en un
factor de 3,3
33
Dispositivos de Almacenamiento
Discos pticos
DVD
El DVD usa un mtodo de codificacin ms eficiente
en la capa fsica:
EFM es reemplazado por EFMPlus, con las
mismas caractersticas que el EFM clsico
El subcdigo de CD fue eliminado
Resultado, el formato DVD es un 47% ms
eficiente que el CD-ROM
34
Dispositivos de Almacenamiento
Discos pticos
DVD-5
El tipo mas sencillo de DVD
Posee datos en un solo lado y una nica capa reflectiva
Almacena un total de 4.38 GB reales. Es el mas similar al
CD
35
Dispositivos de Almacenamiento
Discos pticos
DVD-9
Posee dos capas de material reflectivo del mismo lado del
disco, legibles de forma independiente (7.92 GB efectivos)
Capacidad menor que el doble de la versin simple capa
(utiliza surcos 10% mas extensos para facilitar la lectura)
36
Dispositivos de Almacenamiento
Discos pticos
DVD-10
Poseen datos en ambos lados porque utilizan ambos
substratos, cada uno de ellos con una nica capa
Doble de capacidad del DVD-5
Reproduccin de ambos lados dando vuelta el disco
7
37
Dispositivos de Almacenamiento
Discos pticos
DVD-14 / DVD-18
El DVD-18 es el de mayor capacidad, dado que usa ambos
lados y cada uno posee dos capas reflectivas
Casi 16 GB reales para almacenamiento de datos
Es el tipo mas difcil de manufacturar, muy poco comn
38
Dispositivos de Almacenamiento
Discos pticos
Fortalezas y debilidades:
Rendimiento del Tiempo de Bsqueda: problema en
el acceso aleatorio, por su lentitud.
Tasa de Transferencia de Datos: modestaun orden
de magnitud ms lento que discos duros.
39
Dispositivos de Almacenamiento
Discos pticos
Fortalezas y debilidades: (cont.)
Capacidad de Almacenamiento: amplia.
Acceso de slo Lectura: en algunos casos.
Escritura y Lectura Asimtricas para los Discos
pticos: una escritura, muchas lecturas.
40
Almacenamiento Terciario: considera...
(Racks de) Discos pticos.
Cintas.
Silos de Cintas
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
41
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
Cintas:
Usadas, principalmente, para hacer copias de
seguridad.
Baratas y ms lentas que el disco.
Dispositivos de acceso lineal.
Capacidad: 50 gigabytes y ms...
42
Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
Silos de Cintas:
Dispositivos del tamao de una habitacin que
manejan racks de cintas.
Dichas cintas son accesadas por brazos robotizados
que pueden llevarlas a los lectores de cintas
requeridos.
8
43
Dispositivos de Almacenamiento
Criterios de Seleccin
Capacidad.
Portabilidad.
Costo Relativo: respecto del almacenamiento,
velocidad y facilidad de acceso.
Tamao del Registro.
Tiempo de Acceso.
Compartibilidad.
44
1.1 Dispositivos de Almacenamiento
1.2 Discos Magnticos
1.3 Representacin de Datos
Temario
45
Discos Magnticos
Mecnica del Disco
Conjunto de superficies magnetizables, que rotan a
alta velocidad, pasando bajo una cabeza
lectograbadora.
Un pack de disco magntico
(disco duro) est constituido por
varios platos de aluminio
recubiertos de xido magntico.
46
Discos Magnticos
Mecnica del Disco
47
Discos Magnticos
Mecnica del Disco
Cada cara utilizable (superficie) est dividida en
varias pistas concntricas.
El conjunto de pistas (tracks) que pueden ser leidas
sin mover la cabeza lectograbadora, es decir el
conjunto de pistas de varias superficies que tienen el
mismo radio, conforman un cilindro.
48
Discos Magnticos
Mecnica del Disco
El mecanismo de lectura/escritura ms comn de los
discos de un brazo son las cabezas lectograbadoras
que se mueven radialmente sobre las superficies que
giran a gran velocidad.
9
49
Discos Magnticos
Mecnica del Disco
50
Discos Magnticos
Mecnica del Disco
Cada pista es organizada en sectores, los cuales
son segmentos separados por espacios sin datos
(gaps).
El sector es una unidad indivisible, tanto en la
lectura como en la escritura al disco, como en el
manejo de errores.
Los gaps representan alrededor del 10% del total de
la pista; y se usan para identificar el comienzo de un
sector.
51
Discos Magnticos
Mecnica del Disco
52
Discos Magnticos modernos
Uno o dos platos
Zoned Bit Recording
La densidad de bits se
mantiene relativamente
uniforme en las pistas
ms exteriores, respecto
de las interiores
53
Tasa de Transferencia variable
Zona Zona Zona Zona
Pistas / Pistas / Pistas / Pistas /
Zona Zona Zona Zona
Sectores / Sectores / Sectores / Sectores /
Pista Pista Pista Pista
Tasa de Trans. Tasa de Trans. Tasa de Trans. Tasa de Trans.
(Mbits/s) (Mbits/s) (Mbits/s) (Mbits/s)
0 00 0 454 232 92.9
1 11 1 454 229 91.7
2 22 2 454 225 90.4
3 33 3 454 225 89.2
4 44 4 454 214 85.8
5 55 5 454 205 82.1
6 66 6 454 195 77.9
7 77 7 454 185 74.4
8 88 8 454 180 71.4
9 99 9 454 170 68.2
10 10 10 10 454 162 65.2
11 11 11 11 454 153 61.7
12 12 12 12 454 142 57.4
13 13 13 13 454 135 53.7
14 14 14 14 454 122 49.5
3,8 GB Quantum
Fireball
54
Tasa de Transferencia variable
20 GB/plato, 5400
RPM IBM 40GV
Zona Zona Zona Zona
Pistas / Pistas / Pistas / Pistas /
Zona Zona Zona Zona
Sectores / Sectores / Sectores / Sectores /
Pista Pista Pista Pista
Tasa de Trans. Tasa de Trans. Tasa de Trans. Tasa de Trans.
(Mbits/s) (Mbits/s) (Mbits/s) (Mbits/s)
0 00 0 624 792 372.0
1 11 1 1,424 780 366.4
2 22 2 1,680 760 357.0
3 33 3 1,616 740 347.6
4 44 4 2,752 720 338.2
5 55 5 2,880 680 319.4
6 66 6 1,904 660 310.0
7 77 7 2,384 630 295.9
8 88 8 3,328 600 281.8
9 99 9 4,432 540 253.6
10 10 10 10 4,528 480 225.5
11 11 11 11 2,192 440 206.7
12 12 12 12 1,600 420 197.3
13 13 13 13 1,168 400 187.9
14 14 14 14 18,15 370 173.8
10
55
Discos Magnticos
Mecnica del Disco
Sector v/s Bloque:
El sector es una unidad fsica del disco, mientras
que un bloque es una unidad lgica, creacin de un
software (S.O., SABD) para usar el disco.
Tpicamente un bloque tiene al menos la misma
capacidad de un sector, pudiendo contener varios
ms.
56
Discos Magnticos
Controlador del Disco
Uno o ms discos son controlados por el controlador
de disco, que es un pequeo procesador capaz de :
Controlar el brazo mecnico que mueve las cabezas
lectograbadoras a un radio especfico. En ste, una
pista de cada superficie estar bajo la cabeza
correspondiente, y podr ser leida/escrita.
57
Discos Magnticos
Controlador del Disco
Seleccionar una superficie a leer/escribir, y
seleccionar un sector desde la pista asociada. El
controlador tambin es responsable de determinar
cuando se ha alcanzado el inicio del sector requerido.
Transferir los bits ledos desde el sector del disco a
la memoria principal del computador, transferir los bits
en sentido contrario en caso de una operacin de
escritura.
58
Discos Magnticos
Caractersticas de Almacenamiento
Velocidad de Rotacin: 5.400 rpm...
Platos por Unidad: 5 platos (8 superficies
utilizables)
Pistas por Superficie: 10.000
Sectores por Pista: 500 ...
Tamao de una Pista: 100.000 bytes
Tamao de un Sector: 512 4.096 bytes
59
Discos Magnticos
Caractersticas de Acceso
Factores que Determinan el Acceso a un Sector:
Tiempo de bsqueda o posicionamiento (seek time).
Tiempo de rotacin (latency time).
Tiempo de transferencia.
60
Discos Magnticos
Caractersticas de Acceso
Tiempo de bsqueda: tiempo necesario para
desplazar las cabezas al cilindro requerido.
Duracin: 7 a 20 milisegundos.
11
61
Discos Magnticos
Caractersticas de Acceso
Tiempo de latencia: tiempo transcurrido desde que
el brazo est en el cilindro requerido y hasta que se
site en la posicin correcta
Duracin: depende de la velocidad de rotacin del
disco; pero un valor tpico es de 11 mseg.
62
Discos Magnticos
Caractersticas de Acceso
Tiempo de Transferencia: tiempo para realizar la
transferencia de los bytes solicitados de la RAM al
disco o viceversa.
Es el nico parmetro que depende del nmero
de bytes a transferir.
63
Discos Magnticos
Caractersticas de Acceso
Luego, el tiempo promedio para recuperar un bloque
de disco, desde una pista de N bloques, es:
1 1
T = T
S
+ --- T
L
+ --- T
L
2 N
64
Discos Magnticos
Modificacin de Bloques
No es posible modificar un bloque directamente en
el disco.
Aunque se quiera modificar el mnimo de bytes, se
requiere manejar el bloque completo.
65
Discos Magnticos
Modificacin de Bloques
Las operaciones necesarias para la modificacin
son
Leer el bloque a la memoria principal.
Hacer los cambios sobre la copia en la memoria
principal.
Escribir el contenido del bloque de regreso al disco.
66
Discos Magnticos
Mejorando el Tiempo de Acceso
Tcnica 1: Organizar los Datos por Cilindros
Objetivo: se minimizan los movimientos del brazo
del disco.
Ventaja: aplicaciones con fuerte uso del disco,
donde los accesos pueden ser predecidos y slo hay
un proceso usando el disco, son apoyadas.
12
67
Discos Magnticos
Mejorando el Tiempo de Acceso
Desventaja: no ayuda en casos donde hay varios
procesos pequeos ejecutndose en paralelo,
compartiendo el mismo disco, con acceso no
predecibles.
68
Discos Magnticos
Mejorando el Tiempo de Acceso
Tcnica 2: Usar Mltiples Discos
Objetivo: al contar con N discos, operados bajo un
mismo controlador, el tiempo total asociado a la
lectura/escritura de un bloque de de cada disco, ser
equivalente a la N-sima parte de lo que tardara leer
los N bloques del mismo disco.
69
Discos Magnticos
Mejorando el Tiempo de Acceso
Ventaja: incrementa la tasa a la cual los
requerimientos de disco pueden ser atendidos.
Problema: lecturas y/o escrituras al mismo disco no
pueden satisfechas a la vez, de modo que el factor de
escalabilidad puede ser menos al factor por el cual el
nmero de disco crece.
70
Discos Magnticos
Mejorando el Tiempo de Acceso
Desventaja: el costo de varios discos pequeos
excede el valor un disco nico con la misma
capacidad total.
71
Discos Magnticos
Mejorando el Tiempo de Acceso
Tcnica 3: Usar Discos Espejos
Objetivos:
Agilizar el acceso a los datos, pues la
recuperacin se puede hacer sobre ms de un
disco a la vez.
Evitar que un problema en un disco (incluso fatal
para todo su contenido) implique una prdida de
datos.
72
Discos Magnticos
Mejorando el Tiempo de Acceso
Ventaja: aumenta la tasa a la cual pueden atenderse
los requerimientos de disco, para todo tipo de
aplicaciones.
Ventaja: mejora la tolerancia a fallas.
Desventaja: aumentan los costos debido a los
discos adicionales.
13
73
Discos Magnticos
Mejorando el Tiempo de Acceso
Tcnica 4: Ordenamiento de Solicitudes al Disco.
Objetivo: reducir el impacto del tiempo de bsqueda,
acortando los movimientos de seek sobre el disco,
mediante el algoritmo del ascensor u otro similar.
74
Discos Magnticos
Mejorando el Tiempo de Acceso
Ventaja: reduce el tiempo promedio de accesos al
disco cuando stos no son predecibles.
Problema: el algoritmo es ms efectivo en
situaciones donde hay muchas solicitudes al disco
esperando, y la espera promedio de los procesos
involucrados es alta.
75
Discos Magnticos
Mejorando el Tiempo de Acceso
Tcnica 5: Prefetching / Doble Buffering
Objetivo: cuando se pueden predecir los accesos, es
posible cargar algunos bloques a la memoria principal
antes de que sean realmente necesitados.
Ventaja: agiliza los tiempos de acceso, en
situaciones de predecibilidad de los datos.
Desventaja: requiere (buffers de) memoria principal
extra; no sirve cuando los accesos son aleatorios.
76
Discos Magnticos
Mejorando el Tiempo de Acceso
Observaciones:
Un archivo de datos abierto tiene, al menos, un
buffer asociado.
Un buffer reside en la memoria principal, ya sea en
el rea del programa o fuera de l (pool de buffers).
Su tamao debe ser lo suficientemente grande para
contener un bloque.
77
Discos Magnticos
Mejorando el Tiempo de Acceso
Otras tcnicas posibles:
Para minimizar la latencia, los datos pueden ser
ubicados de tal forma que el sector que contenga el
dato sea aqul que est justo bajo la cabeza cuando
ste es requerido, es decir intercalacin de sectores.
78
Discos Magnticos
Mejorando el Tiempo de Acceso
1
2
3
4
5
6
7
8
9
10
11 12
13
14
15
16
17
18
19
20
21
22
23 24
Sectores Contiguos
(Se requieren 24 revoluciones
para leer pista completa)
1
2
3
4
5 6
7
8
9
10
11
12
13
14
15
16
17 18
19
20
21
22
23
24
Sectores Intercalados
(se requieren 5 revoluciones)
14
79
Discos Magnticos
Mejorando el Tiempo de Acceso
Otras tcnicas posibles (continuacin):
Cabezas Fijas: hace nulo el tiempo de bsqueda.
Aumento de la densidad de Almacenamiento: debido
al uso de pelculas magnticas ms delgadas, y a
cabezas ms precisas y finas.
80
Discos Magnticos
Tipos de Fallas
Falla intermitente: cuando un intento por leer o
escribir un sector no es exitoso, pero tras algn(os)
intento(s) se logra realizar la operacin.
Dao Parcial del Disco: cuando uno o ms bits se
corrompen, y llega a ser imposible leerlos
correctamente, no importa las veces que se intente.
81
Discos Magnticos
Tipos de Fallas
Falla en la Escritura: cuando se trata de escribir un
sector, pero no es posible escribirlo ni volverlo a
recuperar. Una causa posible es la una cada de
potencia al momento de la escritura.
Dao Total del Disco: donde el disco completo, de
forma repentina y permanente, deja de estar
disponible.
82
Discos Magnticos
Manejo de Fallas: Paridad
Fallas intermitentes pueden ser corregidas mediante
las sumas de chequeo, basadas en la tcnica de la
paridad.
La paridad consiste en registrar algunos bits
adicionales, por sector, cuyos valores dependen del
contenido de ste.
83
Discos Magnticos
Manejo de Fallas: Paridad
As, al leer el sector, se chequea su contenido con
los bits de paridad y si stos no concuerdan, se dice
que el sector est malo.
84
Discos Magnticos
Manejo de Fallas: Paridad
Ejemplo de Paridad:
Datos: 00 10 00 11
Paridad: 1
Datos: 00 11 00 11
Paridad: 0
15
85
Discos Magnticos
Manejo de Fallas: Paridad
El problema de la paridad anterior es que si dos bits
se ven modificados, el sistema ser incapaz de
detectar el error.
La solucin es agregar varios bits de paridad, pero a
costa de que el espacio necesitado va en aumento.
86
Discos Magnticos
Manejo de Fallas
Ante la posibilidad de dao permanente del del disco,
existen diversos esquemas desarrollados para reducir
el riesgo de prdida de los datos:
Respaldos
Discos Espejos
Redundancia sobre varios Discos
87
Discos Magnticos
Respaldos
Tcnica de Respaldo: Abuelo - Padre - Hijo,
guardando tres generaciones de archivos.
A
i-1
R
Abuelo
A
i
A
i+1
R
Padre
R
Hijo
T
i-1
T
i
88
Discos Magnticos
Respaldos
Tcnica de Respaldo: Respaldo Peridico.
Cada cierto perodo se saca copia a todo el archivo
(o un disco completo).
Se guardan transacciones del perodo.
Periocidad depende de condiciones del problema.
89
Discos Magnticos
Respaldos
A
1
A
i
A
j
R
1
R
2
R
3
T
1
T
2
T
3
T
i
T
i+1
... ...
Tcnica de Respaldo: Respaldo Peridico.
90
Discos Magnticos
Respaldos
Ejemplo de Estrategia de Respaldo:
El primer da de cada mes copiar el disco
completo.
Cada fin de semana, copiar los archivos
modificados desde el ltimo backup mensual.
Cada noche, copiar los archivos que han
cambiado desde el ltimo backup semanal.
16
91
Discos Magnticos
Respaldos
Tcnica de Respaldo: los dos casos anteriores
corresponden a respaldos del tipo completo, pero con
frecuencia se usan tambin los llamados respaldos
incrementales, de los cuales existen dos
posibilidades:
Respaldos Undo (Pre-Imgenes)
Respaldos Redo (Post-Imgenes)
92
Discos Magnticos
Recuperacin de Archivos
Transacciones
Archivo
Archivo
Actualizado
Pre y/o Post
Imgenes
/
PROGRAMA
ACTUALIZADOR
93
Discos Magnticos
Recuperacin de Archivos
Mtodos de Recuperacin:
Restore-Rerun
Rollback
Rollforward
Archivo
Daado
Respaldo de
algn tipo
Archivo
Recuperado
MTODO DE
RECUPERACIN
94
Discos Magnticos
Recuperacin de Archivos
Mtodo de Recuperacin: Restore-Rerun
Full-backup del
Archivo
Transacciones
Archivo
Recuperado
RESTORE /
RERUN
95
Discos Magnticos
Recuperacin de Archivos
Mtodo de Recuperacin: Rollback
Archivo
Actualizado
Pre-Imagen
Archivo Recuperado
a un estado previo
ROLL BACK
96
Discos Magnticos
Recuperacin de Archivos
Full-backup del
Archivo
Post-Imagen
ROLL FORWARD
Archivo Recuperado
a un estado
posterior al dao
Mtodo de Recuperacin: Rollforward
17
97
Discos Magnticos
Recuperacin de Archivos
Puntos de chequeo (checkpoint):
Cuando se est actualizando un archivo, cada cierto
conviene grabar un registro especial en el archivo de
transacciones (y pre-imgenes si existe).
Esta marca permite saber, ante fallas de proceso,
hasta donde se haba llegado en el proceso de
actualizacin, para luego reasumir el trabajo desde la
ltima marca.
98
Discos Magnticos
Recuperacin de Archivos
Puntos de Chequeo:
checkpoint
rehacer de ac
en adelante
checkpoint
checkpoint

Transacciones
99
Discos Magnticos
Manejo de Fallas
Ante la posibilidad de dao permanente del del disco,
existen diversos esquemas desarrollados para reducir
el riesgo de prdida de los datos:
Respaldos
Discos Espejos
Redundancia sobre varios Discos
100
Discos Magnticos
Discos RAID
Objetivo: basarse en la diversidad de las vas de
E/S, pues se obtiene un sistema con varios discos,
cada uno con una va de acceso diferente (incluye un
proceso distinto).
Alternativa para
Paralelismo de la E/S.
Disponibilidad de los datos.
101
Discos Magnticos
Discos RAID
Para asegurar la independencia de una va, es
preciso almacenar los datos en diversos sitios o
discos, surgiendo el concepto de arreglo de discos,
los que combinan tcnicas como:
Discos Sincrnicos.
Archivos Entrelazados.
102
Discos Magnticos
Discos RAID
Las dos tcnicas anteriores dan origen a los
llamados sistemas RAID, definidos como: arreglo
(vector) redundante de discos independientes.
Por fines prcticos, slo se vern los sistemas de
uso comn en la realidad.
18
103
Discos Magnticos
Discos RAID
Favorece integridad de datos, tolerancia a fallas,
throughput o capacidad, dependiendo del tipo de
RAID utilizado.
Se combinan varios dispositivos fsicos, pero
lgicamente el S.O. ve solo una unidad.
104
Discos Magnticos
Discos RAID
Usualmente utilizados en servidores, pero tambin
en PCs avanzados (p.ej. para edicin de audio y
video), dada la compatibilidad ofrecida por algunas
placas madre.
Segn su configuracin, aparecen niveles de
RAID.
105
Discos Magnticos
Discos RAID
Nivel 0: Sin redundancia
1 2 3
4 5 6
7 8 9
106
Discos Magnticos
Discos RAID
1 4 7 1 4 7
2 5 8 2 5 8
3 6 9 3 6 9
Nivel 1: Discos Duplicados (o espejos)
107
Discos Magnticos
Discos RAID
Nivel 4: Discos Entrelazados a Nivel de Bloques,
con Disco de Paridad
1 2 3 P1
4 5 6 P2
7 8 9 P3
Disco 1 Disco 2 Disco 3 Disco de
Paridad
108
Discos Magnticos
Discos RAID
Nivel 5: Discos Entrelazados a Nivel de Bloques,
con Paridad Distribuida
1 2 3 P1
4 5 P2 6
7 P3 8 9
Disco 1 Disco 2 Disco 3 Disco 4
19
109
Discos Magnticos
Discos RAID
Implementaciones de Sistemas RAID:
En hardware, se requiere un controlador especial de RAID
(integrado en tarjeta madre, tarjeta PCI, contenedor externo)
Mejores rendimientos
Mejor capacidad de almacenamiento
Mejor confiabilidad
Permite reemplazo en caliente
110
Discos Magnticos
Discos RAID
Implementaciones de Sistemas RAID:
En software, S.O. maneja el arreglo mediante el controlador
de disco
Ms flexibilidad de (re)configuracin
Ms barato por unidad de capacidad de almacenamiento
Mas rpido que por HW (en general), pero utiliza ciclos
de CPU
Puede necesitar detencin de sistema para correcciones
111
Discos Magnticos
Discos RAID
Extensiones de implementaciones de Sistemas RAID:
Existen implementaciones hbridas
Pueden utilizarse hot spares
Dependiendo del sistema, pueden configurarse RAIDs
utilizando particiones de un mismo dispositivo fsico (disco
duro)
112
1.1 Dispositivos de Almacenamiento
1.2 Discos Magnticos
1.3 Representacin de Datos
Temario
113
Representacin de Datos
Organizacin Fsica de los Datos
Representacin y organizacin fsica sobre un
medio de almacenamiento (ndices, punteros, listas,
etc.).
Representa la visin del administrador de los
archivos (o de la base de datos, DBA), que es
dependiente del dispositivo.
El archivo es visto como una coleccin de bloques
en memoria secundaria.
114
Representacin de Datos
Organizacin Fsica de los Datos
Operaciones a considerar:
Controlar accesos.
Asignar y administrar buffers.
Crear y mantener directorios.
Crear y mantener tablas en la memoria principal.
20
115
Representacin de Datos
Elementos de Datos
Pregunta a responder: cmo se registran en el
disco los diferentes tipos de datos, al momento de
declaraciones como:
create table ActorDeCine
( nombre CHAR(30),
domicilio VARCHAR(255),
sexo CHAR(1),
fecha_nacimiento DATE
);
116
Representacin de Datos
Elementos de Datos
Tipo CHAR(n): este string de largo fijo se representa
mediante un arreglo de n bytes.
Si el valor guardado tiene un largo menor, se
completa el espacio con algn carcter especial.
117
Representacin de Datos
Elementos de Datos
Tipo VARCHAR(n): este string de largo variable se
puede representar de dos formas:
Largo ms contenido: asignando un arreglo de (n+1)
bytes, siendo el primero de stos el largo real del
dato. Bytes no usados se ignoran.
118
Representacin de Datos
Elementos de Datos
String terminado en Nulo: asigna, tambin, un
arreglo de (n+1) bytes, pero sin registrar el largo, sino
que tras el ltimo byte de dato vlido, se coloca un
carcter nulo.
119
Representacin de Datos
Elementos de Datos
Tipo DATE: representable mediante un string de largo
fijo (tpicamente CHAR(10)).
Ejemplo: 15-04-2004 se presenta con 10 caracteres,
uno por cada dgito ms uno por cada guin.
Una idea similar se sigue con las horas, expresadas
como HH:MM:SS, o similar.
120
Representacin de Datos
Elementos de Datos
En la mayora de los otros tipos de datos, en
particular los BIT(n), booleanos y enumerativos se
representan con tantos bytes como sean suficientes
para contener el total de bits presentes, lo que
normalmente significa que el ltimo de los bytes no se
usa totalmente.
21
121
Representacin de Datos
Registros
Registros de Largo Fijo
struct deposito
{
char nombre_sucursal[20];
int nmero_cuenta;
char nombre_cliente[20];
float saldo;
};
122
Representacin de Datos
Registros de Largo Fijo
Almacenamiento secuencial:
Registro0 Perryridge 102 Hayes 400
Registro1 RoundHill 305 Turner 350
Registro2 Mianus 215 Smith 700
Registro3 Downtown 101 Johnson 500
Registro4 Redwood 222 Lindsay 700
Registro5 Perryridge 201 Williams 900
Registro6 Brighton 217 Green 750
Registro7 Downtown 110 Peterson 600
Registro8 Perryridge 218 Lyle 700

123
Representacin de Datos
Registros de Largo Fijo
Almacenamiento secuencial: problemas...
Difcil la eliminacin de un registro...marca de
borrado o llenar con otro registro.
A menos que el tamao del bloque sea un mltiplo
del registro, algunos registros no podrn almacenarse
completamente en un bloque.
124
Representacin de Datos
Registros de Largo Fijo
Almacenamiento secuencial:
Eliminacin del Registro 2, con corrimientos de
datos
Registro 0 Perryridge 102 Hayes 400
Registro 1 RoundHill 305 Turner 350
Registro 3 Downtown 101 Johnson 500
Registro 4 Redwood 222 Lindsay 700
Registro 5 Perryridge 201 Williams 900
Registro 6 Brighton 217 Green 750
Registro 7 Downtown 110 Peterson 600
Registro 8 Perryridge 218 Lyle 700
125
Representacin de Datos
Registros de Largo Fijo
Almacenamiento secuencial:
Eliminacin del Registro 2, con traslado del registro
8
Registro 0 Perryridge 102 Hayes 400
Registro 1 RoundHill 305 Turner 350
Registro 8 Perryridge 218 Lyle 700
Registro 3 Downtown 101 Johnson 500
Registro 4 Redwood 222 Lindsay 700
Registro 5 Perryridge 201 Williams 900
Registro 6 Brighton 217 Green 750
Registro 7 Downtown 110 Peterson 600
126
Representacin de Datos
Registros de Largo Fijo
Almacenamiento secuencial, con uso de punteros:
Eliminacin de los Registros 1, 4 y 6.
Encabezado
Registro 0 Perryridge 102 Hayes 400
Registro 1
Registro 2 Mianus 215 Smith 700
Registro 3 Downtown 101 Johnson 500
Registro 4
Registro 5 Perryridge 201 Williams 900
Registro 6
Registro 7 Downtown 110 Peterson 600
Registro 8 Perryridge 218 Lyle 700
22
127
Representacin de Datos
Registros de Largo Fijo
Encabezados:
El esquema del registro, o bien un puntero al lugar
donde el SABD almacena el esquema para este tipo
de registro.
El largo del registro.
Marcas de tiempo que indican el momento que el
registro fue modificado/ledo por ltima vez.
128
Representacin de Datos
Registros de Largo Fijo
Encabezados: la base de datos mantiene informacin
del esquema, rescatada del create table, con:
Los atributos de la relacin, y sus tipos.
El orden en el cual aparecen en la tupla.
Restricciones sobre los atributos y la relacin
misma.
129
Representacin de Datos
Registros de Largo Variable
Campo de Largo Variable:
Por lo general, se guardan al final del registro.
En el encabezado se maneja un puntero al inicio de
cada campo de este tipo.
130
Representacin de Datos
Registros de Largo Variable
Campo Repetitivo:
Una alternativa es usar un caracter de separacin
para delimitar los valores repetitivos del campo, y otro
separador para indicar el trmino del campo.
Otra alternativa es usar un puntero a la primera
ocurrencia del campo, ms un nmero que indique la
cantidad de veces de la repeticin.
131
Representacin de Datos
Registros de Largo Variable
Campo de Distintos Tipos:
Cada tipo es precedido por un campo indicador de
tipo.
132
Representacin de Datos
Registros de Largo Variable
Campo Opcional:
Si el nmero total de campos del registro es alto,
pero el nmero de campos fijos es bajo, se puede
incluir una secuencia de duplas <nombre del campo,
valor del campo>, en vez de guardar slo los valores.
La secuencia anterior puede considerar un nmero
de campo, en lugar del nombre + un esquema para
mantener una correspondencia entre los campos y
dichos nmeros.
23
133
Representacin de Datos
Registros de Largo Variable
Grupo Repetitivo:
struct deposito
{
int nmero_cuenta;
char nombre_cliente[20];
float saldo;
};
struct lista-deposito
{
char nombre_sucursal[20];
deposito set(info_cuenta);
}
134
Representacin de Datos
Registros de Largo Variable
Grupo Repetitivo: uso de marca especial como fin de
registro.
Perryridge 102 Hayes 400 201 Williams 900 218 Lyle 700
RoundHill 305 Turner 350
Mianus 215 Smith 700
Downtown 101 Johnson 500 110 Peterson 600
Redwood 222 Lindsay 700
Brighton 217 Green 750
135
Representacin de Datos
Registros de Largo Variable
Grupo Repetitivo: uso de marca especial como fin de
registro .problemas!!
No es fcil volver a usar el espacio que ocupaba un
registro que se elimin.
En general, los registros no disponen de espacio
para crecer.
por lo tanto, no se usa normalmente.
136
Representacin de Datos
Registros de Largo Variable
Grupo Repetitivo: Espacio Reservado.
Perryridge 102 Hayes 400 201 Williams 900 218 Lyle 700
RoundHill 305 Turner 350
Mianus 215 Smith 700
Downtown 101 Johnson 500 110 Peterson 600
Redwood 222 Lindsay 700
Brighton 217 Green 750
137
Representacin de Datos
Registros de Largo Variable
Perryridge 102 Hayes 400
Round Hill 305 Turner 350
Mianus 215 Smith 700
Downtown 101 Johnson 500
Redwood 222 Lindsay 700
201 Williams 900
Brighton 217 Green 750
110 Peterson 600
218 Lyle 700
Grupo Repetitivo: Punteros (bsico)
138
Representacin de Datos
Registros de Largo Variable
Grupo Repetitivo: Punteros con dos archivos.
Perryridge 102 Hayes 400
Round Hill 305 Turner 350
Mianus 215 Smith 700
Downtown 101 Johnson 500
Redwood 222 Lindsay 700
Brighton 217 Green 750
201 Williams 900
110 Peterson 600
218 Lyle 700
24
139
Representacin de Datos
Organizacin de Registros en Bloques
Factor de bloqueo (fb):
tamao del bloque / tamao del registro
En general, el cuociente no entrega un valor exacto.
Luego, se usa la frmula:
tamao del bloque / tamao del registro
Este factor permite saber el nmero de bloques del
archivo.
140
Representacin de Datos
Organizacin de Registros en Bloques
Est la posibilidad de usar el espacio libre que queda
porque el tamao del bloque no es mltiplo del
tamao del registro, mediante registros atravesados
(SPAN).
141
Representacin de Datos
Organizacin de Registros en Bloques
Bloque i Registro 1 Registro 2 Registro 3
Bloque i+1 Registro 4 Registro 5 Registro 6
Registros no Atravesados
Bloque i Registro 1 Registro 2 Registro 3 Registro 4a
Bloque i+1 Registro 4b Registro 5 Registro 6 Registro 7

Registros Atravesados (Registros Span)
Registro 1 Registro 2 Registro 3
Registro 4 Registro 5 Registro 6
Registro 1 Registro 2 Registro 3 Registro 4a
Registro 4b Registro 5 Registro 6 Registro 7
142
Representacin de Datos
Organizacin de Bloques en Archivos
Asignacin Contigua.
Asignacin Enlazada.
bloque bloque bloque bloque
1 2 3 4
bloque bloque bloque bloque
1 2 3 4
143
Representacin de Datos
Organizacin de Bloques en Archivos
4
9
144
Representacin de Datos
Organizacin de Bloques en Archivos
Asignacin Indexada.
25
145
Representacin de Datos
Organizacin de Bloques en Archivos
Un archivo tiene un encabezado o descriptor de
archivo con:
Informacin para determinar las direcciones de disco
de los bloques del archivo.
Descripcin de los formatos de registros: largo de
registro, orden de los campos en el registro,
separadores.
146
Representacin de Datos
BLOBs
Un dato de tipo BLOB representa un dato de gran
tamao.
Ejemplos comunes de datos BLOB son las
imgenes (GIF, JPEG), pelculas en formato MPEG y
el audio.
147
Representacin de Datos
BLOBs
Almacenamiento:
Debe almacenarse como una secuencia de bloques,
comnmente asignados consecutivamente en un
cilindro para ser recuperado fcilmente.
No obstante puede ser almacenado como una lista
enlazada de bloques.
148
Representacin de Datos
BLOBs
Almacenamiento: (cont.)
Por otro lado, puede requerirse que el BLOB sea
recuperado rpidamente, de modo que guardarlo en
un solo disco resulte insuficiente.
Luego, ser necesario particionar el BLOB entre
varios discos, alternando sus bloques entre ellos.
As, varios bloques del BLOB pueden ser ledos a la
vez, aumentando la tasa de recuperacin por un
factor similar al nmero de discos de la particin.
149
FIN

También podría gustarte