Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnologias de Almacenamiento en Disco PDF
Tecnologias de Almacenamiento en Disco PDF
07 08
Tecnologías de
Almacenamiento en
Disco
Sistemas operativos monousuario y
multiusuario
2
Tecnologías de almacenamiento 3
1. Dispositivos de almacenamiento
• Dispositivos de bloques y de caracteres
• Características y funciones:
Discos Duros
Discos ópticos
Discos de estado sólido (SSD)
2. Particiones
• Concepto
• Tipos
Particiones Primarias, Extendidas y lógicas
• MBR
Estructura del MBR
MBR y particiones
MBR y arranque del SO
MBR y identificación de discos
5. ZFS
• Introducción.
ZFS, el sistema de ficheros del futuro
Desarrollo de ZFS
Disponibilidad en distintos SO
• Características detalladas
• ¿Por qué utilizar ZFS?
3
Tecnologías de almacenamiento 4
1. Dispositivos de almacenamiento
D
ispositivo de auxiliares). Cuando se hace esta
almacenamiento es todo distinción, el dispositivo de
aparato que se utilice almacenamiento primario es la
para grabar los datos de un memoria de acceso aleatorio
ordenador de forma permanente o (RAM) de la computadora, un
temporal. Una unidad de disco, dispositivo de almacenamiento
junto con los discos que graba, es permanente pero cuyo contenido
un dispositivo de almacenamiento. es temporal. El almacenamiento
A veces se dice que un ordenador secundario incluye los dispositivos
tiene dispositivos de de almacenamiento más
almacenamiento primarios (o permanentes, como unidades de
principales) y secundarios (o disco y de cinta.
4
Tecnologías de almacenamiento 5
Los dispositivos de caracteres utilizan el acceso secuencial para tratar los datos de
manera que el elemento de lectura del dispositivo debe pasar previamente por
todos los datos almacenados del medio físico almacenado para acceder al
elemento deseado. En los dispositivos de bloques en cambio tienen la capacidad
de acceso aleatorio a los datos, también llamado acceso directo que les permite
acceder a un elemento arbitrario de una secuencia de datos empleando el mismo
tiempo que si estuvieran en secuencia.
5
Tecnologías de almacenamiento 6
Está formado por una carcasa metálica o similar que dentro contiene una
serie de platos metálicos apilados girando a gran velocidad (entre 4000 y
15000 rpm). Sobre estos platos se sitúan los cabezales encargados de leer o
escribir los impulsos magnéticos.
Tal y como sale de fábrica, el disco duro no puede ser utilizado por un sistema
operativo. Antes tenemos que definir en él un formato de bajo nivel, una o más
particiones y luego hemos de darles un formato que pueda ser entendido por
nuestro sistema.
6
Tecnologías de almacenamiento 7
• Plato: Cada uno de los discos que hay dentro del disco duro.
• Cilindro: Conjunto de varias pistas; son todas las circunferencias que están
alineadas verticalmente (una de cada cara).
• Sector: Cada una de las divisiones de una pista. El tamaño del sector no es
fijo, siendo el estándar actual 512 bytes. Antiguamente el nº de sectores por
pista era fijo, lo cual desaprovechaba el espacio significativamente, ya que
en las pistas exteriores pueden almacenarse más sectores que en las
interiores. Así, apareció la tecnología ZBR (grabación de bits por zonas) que
aumenta el número de sectores en las pistas exteriores, y usa más
eficientemente el disco duro.
7
Tecnologías de almacenamiento 8
8
Tecnologías de almacenamiento 9
• Latencia: Tiempo que tarda el disco en girar media vuelta, que equivale al
promedio del tiempo de acceso (tiempo medio de acceso). Una vez que la
aguja del disco duro se sitúa en el cilindro el disco debe girar hasta que el
dato se sitúe bajo la cabeza; el tiempo en que esto ocurre es, en promedio,
el tiempo que tarda el disco en dar medio giro; por este motivo la latencia es
diferente a la velocidad de giro, pero es aproximadamente proporcional a
ésta.
• Caché de pista: Es una memoria de estado sólido, tipo RAM, dentro del
disco duro de estado sólido. Los discos duros de estado sólido utilizan cierto
tipo de memorias construidas con semiconductores para almacenar la
información. El uso de esta clase de discos generalmente se limita a las
supercomputadores, por su elevado precio.
9
Tecnologías de almacenamiento 10
Imagen
10
Tecnologías de almacenamiento 11
11
Tecnologías de almacenamiento 12
El láser al pasar por la superficie del disco, se refleja con diferente intensidad
dependiendo de si pasa por un Pit o por un Land, quedando este reflejo
registrado por un detector fotoeléctrico. La intensidad de la luz reflejada es
menor cuando el láser pasa por un Pit, y mayor cuando lo hace por un Land.
Estos cambios de intensidad (determinados por el principio y el final de un Pit,
o dicho de otra manera, el paso de un Pit a un Land y de un Land a un Pit)
permiten reconocer la información contenida en el disco óptico, ya que al
producirse un cambio en la intensidad de la luz reflejada tenemos un 1, y el
tiempo que dure este cambio de intensidad, se corresponde con el número
de ceros que siguen a ese 1 .
12
Tecnologías de almacenamiento 13
En los discos de doble cara se pueden usar las dos caras del disco pero no
son de fácil acceso con una unidad estándar, ya que exigen que se gire
físicamente el disco para acceder a los datos del otro lado.
En los discos de doble capa (DL) existen dos capas de datos separados por
un semi-capa reflectante que permite grabar el doble de capacidad. Ambas
capas son accesibles desde el mismo lado y requieren que la óptica pueda
cambiar el enfoque del láser. La tradicional capa única (SL) de escritura de
los discos, se introduce con una ranura espiral moldeada en la capa
protectora de policarbonato (no en la capa de grabación de datos), para dirigir
y sincronizar la velocidad de grabación del cabezal. En los discos de doble
13
Tecnologías de almacenamiento 14
Mecanismos de rotación
14
Tecnologías de almacenamiento 15
15
Tecnologías de almacenamiento 16
Nomenclatura y designación
16
Tecnologías de almacenamiento 17
Existe otro tipo de discos denominados de estado sólido que utilizan cierto
tipo de memorias construidas con semiconductores de 50nm para almacenar
la información.
17
Tecnologías de almacenamiento 18
2. Particiones
U
na partición de disco, en unidad de almacenamiento
informática, es el nombre completamente formateada es en
de cualquier división de realidad una partición primaria que
un disco, siendo el disco duro el ocupa todo el disco; en dicho caso,
caso más común para esta técnica. el término partición es poco usado,
La técnica consiste en dividir un siendo en este caso sustituido por
disco en varias partes, las cuales otro termino más familiar, como
actúan y son tratadas por el formato del disco. Esta técnica
sistema como discos simple que puede considerarse
independientes, sin embargo, estas como un precursor de la gestión de
divisiones están presentes en un volúmenes lógicos, en inglés
mismo disco físico. Cualquier Logical Volume Management
(LVM).
18
Tecnologías de almacenamiento 19
2.1. Concepto
19
Tecnologías de almacenamiento 20
2.2. Tipos
El formato o sistema de archivo de las particiones (e.j. EXT3) no debe ser
confundido con el tipo de particiones (e.j. partición primaria), ya que en realidad no
tienen directamente mucho que ver. Independientemente del sistema de archivos
de una partición existen 3 tipos diferentes de particiones: particiones primarias,
extendidas y lógicas.
Son las divisiones crudas o primarias del disco, sólo puede haber 4 de éstas.
Depende de una tabla de particiones. Un disco físico completamente
formateado, consiste en realidad de una partición primaria que ocupa todo el
espacio del disco y posee un sistema de archivos. Este tipo de particiones
cualquier sistema operativo puede detectarlas y asignarles una unidad,
siempre y cuando el sistema operativo reconozca su formato (sistema de
archivos).
20
Tecnologías de almacenamiento 21
particiones no activas. Por ejemplo, los gestores LILO, GRUB (muy comunes
en el sistema Linux) y XOSL no buscan por encima de la tabla de partición en
total; simplemente carga una segunda etapa (que puede ser contenida en el
resto del sector 0 ó en el sistema de archivo).
Es otro tipo de partición que actúa como una partición primaria; sirve para
contener infinidad de unidades lógicas en su interior. Fue ideada para romper
la limitación de 4 particiones primarias en un solo disco físico. Solo puede
existir una partición de este tipo por disco, y solo sirve para contener
particiones lógicas. Por lo tanto, es el único tipo de partición que no soporta
un sistema de archivos directamente.
21
Tecnologías de almacenamiento 22
22
Tecnologías de almacenamiento 23
23
Tecnologías de almacenamiento 24
24
Tecnologías de almacenamiento 25
La firma del disco fue introducida por Windows NT, pero actualmente la
usan varios sistemas operativos, incluida las versiones de la 2.6 en adelante
del kernel de Linux. Se usa la firma del disco como un índice del registro del
SO, donde guarda la relación entre particiones y letras/dispositivos de disco.
Windows NT también lo usa en el fichero boot.ini para indicar las particiones
con marca bootable y Linux usa la firma del disco al arrancar para determinar
la posición del volumen de arranque.
25
Tecnologías de almacenamiento 26
L
os sistemas de sectores en archivos y
archivos (filesystem en directorios y mantiene un
inglés), estructuran la registro de qué sectores
información guardada en una pertenecen a qué archivos y
unidad de almacenamiento cuáles no han sido utilizados.
(normalmente un disco duro) En la práctica, un sistema de
de un ordenador, que luego archivos también puede ser
será representada ya sea utilizado para acceder a datos
textual o gráficamente generados dinámicamente,
utilizando un gestor de como los recibidos a través de
archivos. una conexión de red (sin la
organización de estos
26
Tecnologías de almacenamiento 27
3.1. Funciones
Los sistemas de archivos tradicionales proveen métodos para crear, mover,
renombrar y eliminar tanto archivos como directorios, pero carecen de métodos
para crear, por ejemplo, enlaces adicionales a un directorio o archivo (enlace duro
en Unix) o renombrar enlaces padres (".." en Unix).
27
Tecnologías de almacenamiento 28
de izquierda a derecha y separados por algún carácter especial que suele ser una
barra ('/') o barra invertida ('\') y puede terminar en el nombre de un archivo
presente en la última rama de directorios especificada.
28
Tecnologías de almacenamiento 29
3.2. Journaling
El journaling es un mecanismo por el cual un sistema informático puede
implementar transacciones. También se le conoce como "registro por diario".
2. Se realiza la modificación.
4. Si en cualquier momento se quiere cancelar la transacción se deshacen los
cambios uno a uno leyéndolos y borrándolos del journal.
29
Tecnologías de almacenamiento 30
• Estructuras de directorio.
30
Tecnologías de almacenamiento 31
• ext3: sistema de Linux nativo con journaling. Similar a ext2 pero con diario de
transacciones para evitar que apagados accidentales puedan deteriorar el sistema
de ficheros. Posee características avanzadas del trato de meta datos de los
ficheros y es un sistema de ficheros que soporta prácticamente cualquier
plataforma de sistema operativo.
• ext2: Es el sistema de ficheros que utiliza Linux por defecto, básicamente igual que
ext3 pero sin journaling. Soporta características avanzadas: propietarios, permisos,
enlaces, etc. Permite gestionar meta datos en los ficheros y soporta gran variedad
de sistemas operativos.
• vfat: es una ampliación del sistema de ficheros msdos, con soporte para nombres
largos de ficheros. Existen los tipos VFAT16 y VFAT32 (versiones de 16 y 32 bits
respectivamente), y en ambos casos sólo tienen características monousuario: no
admiten propietarios de ficheros y los permisos son muy limitados. Los caracteres y
la longitud de los nombres de archivos están muy limitados. Sin embargo es el
sistema más utilizado en memorias portátiles dada su ligereza y simplicidad.
• jfs: viene del inglés Journaled File System, es un sistema de archivos con respaldo
de transacciones desarrollado por IBM y usado en sus servidores. JFS sigue el
principio de metadata only. En vez de una completa comprobación sólo se tienen
en cuenta las modificaciones en los meta datos provocadas por las actividades del
sistema. Esto ahorra una gran cantidad de tiempo en la fase de recuperación del
sistema tras una caída.
31
Tecnologías de almacenamiento 32
Tabla comparativa:
16 32
Nombre completo 2nd 3rd Virtual File Journaled XFS
extended extended Allocation Table File
file system file System
system
Fecha introducción 1993 2001 1988 1996 1990 1994
Tamaño máx. 2 TiB 16 GiB – 4 GiB 4 PiB 8 EB
archivo 2 TiB
Tamaño máx. 16 TiB 2 TiB – 32 4 GiB 2 TiB 32 PiB 8 EB
Volumen TiB
Longitud nombre 255 bytes 255 bytes 8 bytes + 3 de 255 bytes 255 bytes
de archivo extensión, 255
bytes con LFNs
Nº máx. archivos 1018 Variable 65517 Sin límite Sin límite
268.435.43 definido definido
7
Compresión/Cifrad Si(opciona No/No(en No/No No/No No/No(en No/No(en
o l)/No bloques bloques bloques
Transparentes dispositivo) dispositivo) dispositivo)
Permisos de Sí Sí (Unix, No No Sí Sí
acceso a archivos (POSIX) Linux, (POSIX,
ACLs) ACLs)
Meta datos No Sí No No Sí Sí
Journaling No Sí No No Sí Sí
SO soportados Linux, Linux, Tarjetas de AIX, IRIX, Linux,
BSD, BSD, memoria y OS/2, FreeBSD
Windows Windows pendrives, Linux
(mediante (mediante disquetes,
IFS), IFS), Windows, Linux
MacOS X MacOS X
32
Tecnologías de almacenamiento 33
E
n ciertas ocasiones, el es un engorro.
particionado tradicional de
También se puede presentar el
un disco duro no es
caso en el que necesitemos
suficiente para aprovechar al
particiones muy grandes, para un
máximo el espacio. Los
servidor ftp por ejemplo. Los
volúmenes lógicos son una
enlaces simbólicos podrían
solución a este problema. Cuando
solventar un poco el problema,
se crean particiones para un
pero con el tiempo se convertirán
sistema GNU/Linux, se hace un
en una chapuza que nos hará la
cálculo aproximado del tamaño que
vida imposible. Los volúmenes
vamos a necesitar, pero si
lógicos permiten añadir espacio
necesitamos aún más, tendremos
adicional a volúmenes ya creados
que reparticionar el disco, lo cual
de manera transparente y simple.
33
Tecnologías de almacenamiento 34
4.1. Conceptos
4.2. Funciones
34
Tecnologías de almacenamiento 35
Otra alternativa sería dejar una cierta cantidad de espacio del disco sin asignar y
cuando fuera necesario, expandir el volumen.
35
Tecnologías de almacenamiento 36
4.3. Descripción
4.3.1. LVM
Un Logical Volume Manager se descompone en tres partes:
• Volúmenes físicos (PV): son los discos duros, particiones o cualquier otra
"cosa" que parezca un disco duro (RAID)
Por ejemplo, teniendo como referencia la imagen del comienzo del artículo,
supongamos que tenemos un VG llamado CASA, con 4MB de PE, al que
queremos añadir un LV para /tmp/. Añadimos dos particiones de disco,
/dev/sda4 y /dev/sdb3, que se llamarán PV1 y PV2 (se las puede renombrar
a discreción del usuario). Los PV's pueden ser de distinto tamaño y por lo
tanto, tendrán un número distinto de PE, por lo que supongamos que
tenemos para PV1 99 PE's y para PV2 248 PE's. Ahora, podemos crear el
LV que necesitamos, que puede ser de cualquier tamaño entre 1 y 347
(99+248) PE. De esta forma se crea una tabla que relaciona PE's y LE's y si,
por ejemplo, escribimos 4 MB en el LE número 1 del LV, se corresponderán
con el PE 51 de la PV1.
36
Tecnologías de almacenamiento 37
Destino Origen
Primer chunk Primer chunk
de la LE1 de la PV1
Segundo
Primer chunk
chunk de la
de la PV2
LE1
Tercer chunk Segundo chunk
de la LE1 de la PV1
... ...
Instantáneas (Snapshots)
37
Tecnologías de almacenamiento 38
Un ejemplo práctico
Tenemos un disco duro con tres particiones. Cada una de estas particiones
va a ser posteriormente el punto de montaje para /var /usr que es donde van
a tener los datos en su mayoría los servidores. Las particiones son /dev/sdb1
y /dev/sdb2 (cada cual tendrá sus particiones). Lo primero es crearlas o si ya
las tenemos creadas darles el tipo 8e que es el tipo LVM. Para esta tarea he
usado el cfdisk:
cfdisk /dev/sdb
pvcreate /dev/sdb1
pvcreate /dev/sdb2
38
Tecnologías de almacenamiento 39
Vgdisplay
39
Tecnologías de almacenamiento 40
VG Size 8.46 GB
PE Size 4 MB
Total PE 2166
Alloc PE / Size 0 / 0
Free PE / Size 2166 / 8.46 GB
VG UUID qFePyg-SvH1-Q10s-i885-1ZF2-hurF-VsPCnW
Lo más importante que hay que observar son los tres primeros elementos.
También es importante que el VG Size sea aproximadamente igual al
tamaño de los discos o particiones sumados. En mi caso deberían ser 9 GB,
pero se quedan en 8.46 GB. Imagino que es por información que usa en
cada una de las particiones para uso interno del LVM.
40
Tecnologías de almacenamiento 41
mkfs.reiserfs /dev/grupo_servidores/usr
mkfs.reiserfs /dev/grupo_servidores/var
Puntos finales
Bien ahora solo queda hacer que cada una de las particiones sea realmente
/usr y /var para ello vamos a montar primero /dev/grupo_servidores/usr y var
en /mnt para copiar en el sistema montado lo que tenemos en /usr. Veamos
como hacerlo:
41
Tecnologías de almacenamiento 42
Ahora hay que añadir las entradas al fstab para que cuando se inicie el
sistema se consigan montar las particiones y así funcionar sobre LVM. El
archivo fstab quedaría así:
Finalmente hay que añadir al Init del sistema que active el grupo volumen
para que así pueda montar el kernel el sistema de ficheros de manera
correcta. Entonces en /etc/rcS.d/ añadimos lo siguiente:
ln -s /etc/init.d/lvm S25lvm
Nada más, ahora solo que reiniciar el sistema. Una cosa deberíais de tener
una manera por ahí para poder arrancar en caso de que esto “casque”, un
cd de knoppix o el rescue de Debian.
42
Tecnologías de almacenamiento 43
4.3.2.EVMS
El Enterprise Volume Management System (EVMS) es un software de
gestión de volúmenes flexible e integrado que permite gestionar sistemas de
almacenamiento bajo GNU/Linux.
43
Tecnologías de almacenamiento 44
5 . ZFS
Z
FS es una nueva ZFS no es una mejora
clase de sistema de incremental de la tecnología
ficheros que existente; es
proporciona una fundamentalmente un nuevo
administración simple, acercamiento a la
semántica transaccional, administración/gestión de
integridad de los datos, y una datos.
inmensa escalabilidad.
44
Tecnologías de almacenamiento 45
5.1. Introducción
ZFS destaca por su gran capacidad (128 bits), integración de los conceptos
anteriormente separados de sistema de ficheros y administrador de
volúmenes en un solo producto (detección y corrección de errores y sistema
Z-RAID integrado), nueva estructura sobre el disco (bloques de tamaño
variable), sistemas de archivos ligeros, y una administración de espacios de
almacenamiento sencilla.
OpenSolaris
45
Tecnologías de almacenamiento 46
Nexenta
FreeBSD
Mac OS X
46
Tecnologías de almacenamiento 47
El instalador para "ZFS Read / Write 1.1 Developer Preview de Leopard" por
el momento sólo se trabaja en la versión 10.5.0, y no ha sido actualizado
para la versión 10.5.1 y superior. A partir de enero de 2008, Apple pone a
disposición los binarios y el código fuente pero debe ser instalado
manualmente. Alex Blewitt ha puesto juntos el instalador para los binarios y
ya no es necesaria ninguna instalación manual.
Linux
Mantener un sistema de ficheros fuera del kernel del Unix tradicional puede
tener un impacto significativo en el rendimiento. Sin embargo, NTFS-3G
(otro sistema de archivos basado en FUSE) obtiene un buen rendimiento
en comparación con el sistema de ficheros habitual. Esto demuestra que es
posible un rendimiento excelente de ZFS en Linux después de una
optimización adecuada. Por otra parte Sun Microsystems ha afirmado que
están investigando la portabilidad a Linux.
47
Tecnologías de almacenamiento 48
Pero los discos baratos pueden fallar, así que ZFS proporciona “barrido” del disco.
Al igual que la memoria ECC, la idea es leer todos los datos para detectar errores
latentes mientras éstos puedan ser corregidos. Un “barrido” atraviesa el pool entero
48
Tecnologías de almacenamiento 49
del almacenamiento para leer cada copia de cada bloque, validarla contra la suma
de comprobación 256-bit, y repararla en caso de necesidad. Todo ésto sucederá
mientras el pool de almacenamiento siga vivo y en uso.
No hay límites arbitrarios en ZFS. Puedes tener tantos ficheros como desees; offset
de 64-bit del fichero; enlaces/links ilimitados, entradas de directorio, snapshots,
etcétera.
49
Tecnologías de almacenamiento 50
50
Tecnologías de almacenamiento 51
Utiliza también RAIDZ, uno de los pocos sistemas de raid (tipo raid 5) que no
sufren del temido "write hole" gracias a la implementación de sistemas de "copy on
write".
Por todo esto, los ejemplos de uso pueden llegar a ser innumerables; resumiendo
diré que cualquier proyecto o aplicación informática que requiera el manejo de
muchos datos a la vez y sean de tamaño considerable y que necesite acceso
continuo e ininterrumpido a los mismo así como garantizar un control total sobre
su estructura, la mejor opción que tiene es ZFS.
51
Tecnologías de almacenamiento 52
Bibliografía
• Nikos Drakos y Ross Moore, Linux (Unix ) para usuarios, 1993-1999. Traducción
por Pedro Pablo, 2001
http://fabregaruz.net/shell/node1.html
• Daniel Lombraña González, Como montar LVM en una máquina Debian, 2003
• http://bulma.net/body.phtml?nIdNoticia=1859
• Red Hat, Inc, Red Hat Enterprise Linux 3: Manual de administración del
sistema, 2003
http://web.mit.edu/rhel-doc/3/rhel-sag-es-3/index.html
52
Tecnologías de almacenamiento 53
• Fernando Remiro Domínguez, Antonio J. Gil Padilla, Luís Cuesta García, Jesús
García García-Doncel, Germán Lorenzo (revisión técnica) , Arquitectura de
equipos y sistemas informáticos, 2005 Ed. McgrawHill
53