Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hay tres conceptos de almacenamiento aplicados con mayor frecuencia en entornos de TI.
Estos conceptos se denominan almacenamiento adjunto directo o DAS para NAS y SAN, la
red de área de almacenamiento.
Los almacenamientos conectados directamente típicos son los dispositivos ETERNUS JX40
y JX60 JBOD.
Los dispositivos SAN crean la mayoría del almacenamiento en entornos de TI. Estos son
sistemas dedicados de alto rendimiento con las funcionalidades incluidas para controlar
las unidades, el RAID y los volúmenes. Las funcionalidades adicionales como el
almacenamiento automático en niveles, la calidad del servicio, la captura de imágenes, la
clonación y la replicación aumentan su eficiencia. Se pueden conectar varios servidores en
paralelo a través de SAS, iSCSI, Fibre Channel o Fibre Channel a través de Ethernet y los
propios servidores controlan el sistema de archivos en los volúmenes. Como los
dispositivos de almacenamiento no conocen el tipo de datos en los volúmenes y no
controlan el sistema de archivos, también se denominan sistemas de almacenamiento en
bloque.
SAN se puede utilizar para cualquier tipo de datos. Como almacenamiento central, puede
almacenar datos de usuarios y aplicaciones, puede ser utilizado por clústeres de
virtualización como un almacén de datos común, los servidores instalados de forma nativa
pueden acceder a él, por lo que es una solución perfecta para entornos heterogéneos.
El grado de virtualización ha alcanzado un nivel muy alto y cada vez más empresas están
introduciendo la virtualización de escritorios para reducir los esfuerzos de administración
y los costos de sus dispositivos cliente. Para la virtualización de servidores y escritorios, las
demandas en términos de latencia deseada e IOPS aumentan constantemente. Si bien
tienen más máquinas virtuales con requisitos más altos en el mismo almacenamiento
central, las diferentes aplicaciones compiten entre sí.
Eso lleva a la necesidad de priorizar los recursos para optimizar IOPS y la latencia para las
aplicaciones más importantes.
RAID0:
RAID0 no aumenta la seguridad de los datos. Debido a eso, rara vez se usa y solo es
adecuado para datos que requieren un alto rendimiento pero no seguridad.
El rendimiento del acceso a datos aumenta al dividir los datos en bloques y distribuir estos
bloques entre las unidades disponibles. Por eso, cada unidad tiene que manejar solo una
parte de los datos. Leer y escribir datos se vuelve mucho más rápido ya que se deben
escribir cantidades más pequeñas de datos en cada disco. Se requieren al menos dos
discos para RAID0. Cuantos más discos se usen en este nivel RAID, mayor será el
rendimiento.
En una configuración RAID1, se duplican dos unidades. Cada bloque de datos también está
disponible en la segunda unidad. Es por eso que solo el 50% de la capacidad bruta es
utilizable, pero una sola unidad fallida no conduce a la pérdida de datos. El rendimiento de
un RAID 1 es similar al rendimiento de un solo disco.
En los servidores, este nivel RAID se usa generalmente para los sistemas operativos. En los
dispositivos SAN, este nivel de RAID no se usa con frecuencia, ya que normalmente se
requiere más capacidad que la que proporciona una sola unidad.
RAID10:
El 50% de la capacidad bruta en un RAID10 es utilizable, pero solo una unidad por grupo
de unidades puede fallar sin pérdida de datos. Debido a eso, puede suceder que una
segunda unidad fallida provoque una pérdida de datos.
Cada subconjunto RAID1 adicional en un RAID10 agrega más IOPS al grupo RAID. Este nivel
RAID se usa generalmente para aplicaciones que exigen un alto rendimiento.
RAID5:
RAID5 distribuye bloques de datos a través de múltiples unidades como en un RAID0. Para
lograr una mayor disponibilidad que en una configuración RAID0, el procesamiento XOR
crea una paridad. Esta paridad se escribe en una unidad además de los datos. No hay una
unidad específica que se utilice para la paridad. La paridad gira sobre las unidades
disponibles para cada banda de datos.
Debido a la paridad, la capacidad de una unidad en el grupo RAID no se puede usar para
datos activos, pero una sola unidad puede fallar sin una pérdida de datos. En caso de que
falle una unidad, la información que falta se puede volver a calcular en función de los
datos existentes y la paridad. Este nivel de RAID es muy efectivo en términos de capacidad
y el rendimiento de las lecturas es muy bueno siempre que todas las unidades estén en
buen estado. En caso de que una unidad falle, el rendimiento de lectura se reduce porque
los datos faltantes deben recalcularse. El rendimiento de escritura se reduce en general
por el proceso de generar y escribir la paridad.
RAID50:
Un RAID 50 usa múltiples subconjuntos RAID5. Los datos se dividen entre ellos en una
configuración RAID0. Por eso, el rendimiento aumenta y los tiempos de reconstrucción se
acortan. Por subconjunto, una unidad puede fallar sin pérdida de datos. RAID 50 se puede
usar para aplicaciones que necesitan una alta capacidad de eficiencia y un mayor
rendimiento que en un RAID5.
RAID6:
RAID6 proporciona una mayor disponibilidad que un RAID5 al usar dos paridades. Debido
a eso, la capacidad de dos unidades no se puede utilizar en este nivel RAID y el
rendimiento de escritura se reduce ya que las dos paridades deben calcularse y escribirse.
Por otro lado, dos unidades pueden fallar sin pérdida de datos. El rendimiento de lectura
es bastante bueno cuando todas las unidades están en buen estado, ya que los datos se
pueden leer desde todas las unidades de datos.
Este nivel RAID se usa para aplicaciones para las que el alto rendimiento no importa pero
donde la eficiencia de la capacidad y la seguridad de los datos están enfocadas. Por lo
general, se usa para servidores de archivos o aplicaciones de archivo.
RAID6-FR:
Debido a las dos unidades de paridad por subconjunto RAID y la unidad de repuesto
dinámico incluida adicional, la eficiencia de los datos no es óptima, pero el tiempo de
reconstrucción se reduce drásticamente. Debido a que este nivel de RAID se utiliza sobre
todo cuando las unidades de disco duro de gran capacidad se utilizan con el fin de datos
de archivo con las demandas de bajo rendimiento.
RECOMENDACIONES:
En caso de que se usen SSD, se recomiendan RAID10, RAID5, RAID50 y RAID6. Por
supuesto, también se puede usar RAID6-FR, pero generalmente el tiempo de
reconstrucción no es un problema con los SSD.
Si planea usar unidades de disco con altas capacidades, elija RAID6 o mejor RAID6-FR para
reducir el tiempo requerido para la reconstrucción.
Tenga en cuenta que el ETERNUS usa el caché de su controlador RAID para lecturas y
escrituras. Como esto tiene una gran influencia en el rendimiento general, las restricciones
de rendimiento de los niveles de RAID no se consideran tan altas en entornos donde los
requisitos de rendimiento o la carga promedio en el sistema no son altos.
Configure siempre las unidades de repuesto en caliente. Los repuestos dinámicos se utilizan como
unidades de repuesto cuando las unidades de un grupo RAID fallan o muestran signos tempranos
de errores.
Hay repuestos dinámicos dedicados que se asignan a un grupo RAID específico y repuestos
dinámicos globales que están disponibles para cualquier grupo RAID siempre que su capacidad sea
suficiente y su tipo de unidad sea apropiado.
Ahora aprendió los conceptos básicos del concepto SAN. SAN y NAS tienen en común que
siempre hay una instancia que controla el sistema de archivos, ya sea el servidor adjunto o
el almacenamiento en sí. Todos los sistemas de archivos tienen limitaciones en términos
del número máximo de archivos y carpetas. Este no es el único problema.
Los clientes con la necesidad de almacenar miles de millones de archivos tendrían que
separar las aplicaciones y mantener diferentes sistemas de archivos para superar esta
limitación. Como esto no es aceptable, se ha introducido el almacenamiento de objetos.
Ceph es una de las soluciones de almacenamiento de objetos más importantes. Con Ceph,
los datos no se almacenan en forma de bloques de datos o archivos, sino en objetos. Estos
objetos pueden contener datos de la aplicación, atributos de archivo, metadatos y
funciones relacionados con el contenido y son paquetes de información. Ceph usa una
jerarquía muy plana que no usa carpetas y subdirectorios.
Los metadatos no se almacenan centralmente, pero el cliente que accede puede calcular
la información donde se encuentran los datos. Debido a eso, no se requiere una instancia
central para mantener y controlar estos metadatos.
Además, Ceph puede hacer uso de servidores tradicionales con disco local o unidades
flash. Según las políticas, los objetos se distribuyen a través de una red rápida y dedicada
entre los nodos del servidor.
Otro enfoque para almacenar datos es el almacenamiento en cinta. Fujitsu ofrece la serie
ETERNUS LT que contiene bibliotecas de cintas que comienzan con el ETERNUS LT20 que
admite una sola unidad de cinta y 8 ranuras para cintas y termina con el ETERNUS LT260,
que puede equiparse con hasta 42 unidades de cinta y hasta 560 ranuras de cinta.