Está en la página 1de 8

DIFERENTES CONCEPTOS DE ALMACENAMIENTO Y SUS CAMPOS DE APLICACIÓN

Hay tres conceptos de almacenamiento aplicados con mayor frecuencia en entornos de TI.
Estos conceptos se denominan almacenamiento adjunto directo o DAS para NAS y SAN, la
red de área de almacenamiento.

El almacenamiento adjunto directo es una extensión rentable del almacenamiento en el


servidor, lo que significa que el servidor almacena datos en discos internos. Si su número
es insuficiente, el servidor se puede actualizar con un controlador de almacenamiento
adicional con conectores externos que están conectados a un dispositivo JBOD externo.
JBOD significa Just A Bunch of Disks. El dispositivo JBOD es solo un soporte para unidades
adicionales. El concepto es claro y simple. Como el servidor contiene el controlador de
almacenamiento, también controla el RAID, los volúmenes en los grupos RAID y el sistema
de archivos. Es un acceso a nivel de bloque usando el protocolo SAS.

El almacenamiento directo se utiliza para entornos de servidor único donde la cantidad de


unidades que pueden residir en el servidor es insuficiente. También se puede usar en
entornos pequeños con varios servidores, pero no se puede usar como un
almacenamiento compartido al que puedan acceder todos los servidores. Solo se le puede
conectar un único servidor. En caso de que otro servidor que no sea el directamente
conectado desee acceder a los datos residuales, el servidor directamente conectado debe
compartir los datos, por ejemplo, proporcionando un recurso compartido de red.

El almacenamiento conectado directo también se puede utilizar para infraestructuras


hiperconvergentes que desempeñan un papel de rápido crecimiento en TI, ya que hacen
uso de las unidades rentables en los nodos del servidor o en dispositivos JBOD conectados
directamente. Los nodos del servidor actúan juntos como un dispositivo de
almacenamiento virtual. Por lo tanto, los nodos están conectados entre sí a través de una
infraestructura de red dedicada de 1 o 10 Gbit. Según las políticas de resiliencia, los datos
se distribuyen y copian a los nodos asistentes a través de la red de almacenamiento.
Además de eso, los nodos del servidor también se utilizan para alojar máquinas virtuales y
aplicaciones.

Los almacenamientos conectados directamente típicos son los dispositivos ETERNUS JX40
y JX60 JBOD.

El almacenamiento conectado a la red es bien conocido. El dispositivo que proporciona


NAS controla las unidades, el RAID, los volúmenes y el sistema de archivos. Normalmente
se accede a NAS a través de CIFS, NFS o AFS. NFS es en la mayoría de las situaciones la
forma más rápida de acceder a un dispositivo NAS.
NAS se utiliza para proporcionar almacenamiento para datos de usuario, datos de
aplicaciones y como un almacén de datos para copias de seguridad y archivo de datos.
Con un rendimiento suficiente en lata también

se utilizará para proporcionar un almacén de datos donde residen máquinas virtuales en


su interior.

Fujitsu proporciona los sistemas NAS CELVIN y también los dispositivos de


almacenamiento de NetApp. La serie ETERNUS DX también puede proporcionar recursos
compartidos NAS a través de CIFS o NFS, pero se centra en proporcionar almacenamiento
en bloque.

Los dispositivos SAN crean la mayoría del almacenamiento en entornos de TI. Estos son
sistemas dedicados de alto rendimiento con las funcionalidades incluidas para controlar
las unidades, el RAID y los volúmenes. Las funcionalidades adicionales como el
almacenamiento automático en niveles, la calidad del servicio, la captura de imágenes, la
clonación y la replicación aumentan su eficiencia. Se pueden conectar varios servidores en
paralelo a través de SAS, iSCSI, Fibre Channel o Fibre Channel a través de Ethernet y los
propios servidores controlan el sistema de archivos en los volúmenes. Como los
dispositivos de almacenamiento no conocen el tipo de datos en los volúmenes y no
controlan el sistema de archivos, también se denominan sistemas de almacenamiento en
bloque.

SAN se puede utilizar para cualquier tipo de datos. Como almacenamiento central, puede
almacenar datos de usuarios y aplicaciones, puede ser utilizado por clústeres de
virtualización como un almacén de datos común, los servidores instalados de forma nativa
pueden acceder a él, por lo que es una solución perfecta para entornos heterogéneos.

Fujitsu ofrece la familia ETERNUS AF y ETERNUS DX en el campo de SAN. Además del


acceso en bloque, la serie ETERNUS DX también puede proporcionar recursos compartidos
NAS a través de CIFS o NFS. Esta combinación se usa generalmente para la consolidación,
lo que significa que los dispositivos cliente pueden guardar datos directamente en el
ETERNUS sin la necesidad de un servidor de archivos separado.

TIEMPOS DIFÍCILES PARA LOS PROFESIONALES DEL ALMACENAMIENTO

Como saben, las demandas de rendimiento del servidor aumentan constantemente. Lo


mismo se aplica a las soluciones de almacenamiento. Hay cada vez más aplicaciones
diferentes y parcialmente nuevas que se ejecutan en entornos empresariales. El tiempo es
dinero: cuantas más transacciones pueda manejar una solución de almacenamiento en un
momento dado, más rápido devolverá su inversión. Las transacciones se miden en
operaciones de entrada y salida por segundo, IOPS cortas. El tiempo entre enviar una
solicitud y recibir la respuesta se llama latencia. El IOPS entregado por un almacenamiento
debe ser lo más alto posible y la latencia a plena carga debe ser lo más corta posible. Por
lo tanto, la solución de almacenamiento debe estar equipada con módulos de controlador
RAID de alto rendimiento sin cuellos de botella cuando se utilizan muchos discos o SSD.

El grado de virtualización ha alcanzado un nivel muy alto y cada vez más empresas están
introduciendo la virtualización de escritorios para reducir los esfuerzos de administración
y los costos de sus dispositivos cliente. Para la virtualización de servidores y escritorios, las
demandas en términos de latencia deseada e IOPS aumentan constantemente. Si bien
tienen más máquinas virtuales con requisitos más altos en el mismo almacenamiento
central, las diferentes aplicaciones compiten entre sí.

Eso lleva a la necesidad de priorizar los recursos para optimizar IOPS y la latencia para las
aplicaciones más importantes.

Por último, pero no menos importante, la cantidad total de archivos y la capacidad de


datos está aumentando de manera desproporcionada. Los datos especialmente
desestructurados, como los archivos de Office, los correos con sus archivos adjuntos y los
datos del sensor, están aumentando rápidamente. Con el modo unificado del ETERNUS
DX, también es fácil manejarlos sin la necesidad de servidores de archivos adicionales, ya
que el ETERNUS DX puede manejar bloqueos y acceso a archivos simultáneamente.

NIVELES RAID ADMITIDOS

RAID0:

RAID0 no aumenta la seguridad de los datos. Debido a eso, rara vez se usa y solo es
adecuado para datos que requieren un alto rendimiento pero no seguridad.

El rendimiento del acceso a datos aumenta al dividir los datos en bloques y distribuir estos
bloques entre las unidades disponibles. Por eso, cada unidad tiene que manejar solo una
parte de los datos. Leer y escribir datos se vuelve mucho más rápido ya que se deben
escribir cantidades más pequeñas de datos en cada disco. Se requieren al menos dos
discos para RAID0. Cuantos más discos se usen en este nivel RAID, mayor será el
rendimiento.

La capacidad bruta de todas las unidades es totalmente utilizable en un RAID0, pero si


falla una unidad, se pierden todos los datos.
RAID1:

En una configuración RAID1, se duplican dos unidades. Cada bloque de datos también está
disponible en la segunda unidad. Es por eso que solo el 50% de la capacidad bruta es
utilizable, pero una sola unidad fallida no conduce a la pérdida de datos. El rendimiento de
un RAID 1 es similar al rendimiento de un solo disco.

En los servidores, este nivel RAID se usa generalmente para los sistemas operativos. En los
dispositivos SAN, este nivel de RAID no se usa con frecuencia, ya que normalmente se
requiere más capacidad que la que proporciona una sola unidad.

RAID10:

RAID10 combina el rendimiento de RAID0 y la seguridad de datos de RAID1. Un RAID10


requiere al menos cuatro unidades y puede expandirse con un múltiplo de dos unidades.
Siempre dos unidades actúan juntas en una configuración RAID1, por lo que una de las
unidades contiene una copia de los datos. Las dos unidades duplicadas también se
denominan grupo de unidades. Todos los grupos de unidades trabajan juntos en una
configuración RAID0, por lo que cada grupo de unidades solo contiene una porción de
datos, pero dentro del grupo de unidades los datos son redundantes.

El 50% de la capacidad bruta en un RAID10 es utilizable, pero solo una unidad por grupo
de unidades puede fallar sin pérdida de datos. Debido a eso, puede suceder que una
segunda unidad fallida provoque una pérdida de datos.

Cada subconjunto RAID1 adicional en un RAID10 agrega más IOPS al grupo RAID. Este nivel
RAID se usa generalmente para aplicaciones que exigen un alto rendimiento.

RAID5:

RAID5 distribuye bloques de datos a través de múltiples unidades como en un RAID0. Para
lograr una mayor disponibilidad que en una configuración RAID0, el procesamiento XOR
crea una paridad. Esta paridad se escribe en una unidad además de los datos. No hay una
unidad específica que se utilice para la paridad. La paridad gira sobre las unidades
disponibles para cada banda de datos.

Debido a la paridad, la capacidad de una unidad en el grupo RAID no se puede usar para
datos activos, pero una sola unidad puede fallar sin una pérdida de datos. En caso de que
falle una unidad, la información que falta se puede volver a calcular en función de los
datos existentes y la paridad. Este nivel de RAID es muy efectivo en términos de capacidad
y el rendimiento de las lecturas es muy bueno siempre que todas las unidades estén en
buen estado. En caso de que una unidad falle, el rendimiento de lectura se reduce porque
los datos faltantes deben recalcularse. El rendimiento de escritura se reduce en general
por el proceso de generar y escribir la paridad.

RAID5 es adecuado para servidores de archivos o aplicaciones que no necesitan el alto


rendimiento de una configuración RAID10.

RAID50:

Un RAID 50 usa múltiples subconjuntos RAID5. Los datos se dividen entre ellos en una
configuración RAID0. Por eso, el rendimiento aumenta y los tiempos de reconstrucción se
acortan. Por subconjunto, una unidad puede fallar sin pérdida de datos. RAID 50 se puede
usar para aplicaciones que necesitan una alta capacidad de eficiencia y un mayor
rendimiento que en un RAID5.

RAID6:

RAID6 proporciona una mayor disponibilidad que un RAID5 al usar dos paridades. Debido
a eso, la capacidad de dos unidades no se puede utilizar en este nivel RAID y el
rendimiento de escritura se reduce ya que las dos paridades deben calcularse y escribirse.
Por otro lado, dos unidades pueden fallar sin pérdida de datos. El rendimiento de lectura
es bastante bueno cuando todas las unidades están en buen estado, ya que los datos se
pueden leer desde todas las unidades de datos.

Este nivel RAID se usa para aplicaciones para las que el alto rendimiento no importa pero
donde la eficiencia de la capacidad y la seguridad de los datos están enfocadas. Por lo
general, se usa para servidores de archivos o aplicaciones de archivo.

RAID6-FR:

RAID6-FR es un nivel RAID patentado proporcionado por ETERNUS AF y ETERNUS DX con


el objetivo de proporcionar una alta disponibilidad de datos y reducir el tiempo requerido
para una reconstrucción. Combina dos subconjuntos RAID 6 y un repuesto dinámico.

Al reconstruir datos en el disco de reemplazo después de que un disco ha fallado, esta


unidad de destino es un cuello de botella para el rendimiento de la reconstrucción. Debido
a eso, el RAID6-FR incluye una unidad de repuesto dinámico en el grupo RAID para tenerla
disponible a tiempo. Pero, y eso lo hace diferente de otras unidades de repuesto
dinámico, no es un disco específico que es solo un repuesto dinámico. Su capacidad está
reservada parcialmente en todas las unidades disponibles en el grupo RAID. La suma de
las áreas reservadas es igual al tamaño de un solo repuesto dinámico. Si falla una unidad
en este grupo RAID, los datos se reconstruyen en las áreas reservadas. Por eso no hay
cuello de botella para la reconstrucción y el tiempo requerido para reconstruir un terabyte
se reduce de 9 horas a 1,5 horas.

Debido a las dos unidades de paridad por subconjunto RAID y la unidad de repuesto
dinámico incluida adicional, la eficiencia de los datos no es óptima, pero el tiempo de
reconstrucción se reduce drásticamente. Debido a que este nivel de RAID se utiliza sobre
todo cuando las unidades de disco duro de gran capacidad se utilizan con el fin de datos
de archivo con las demandas de bajo rendimiento.

RECOMENDACIONES:

Veamos algunas recomendaciones sobre cuándo elegir qué nivel de RAID.

Si su aplicación requiere un alto rendimiento de lectura y escritura, RAID10 es una buena


opción, pero tenga en cuenta que se pierde el 50% de la capacidad bruta.

Los servidores de archivos, el archivado y las aplicaciones de respaldo generalmente no


requieren el más alto rendimiento y la eficiencia de la capacidad está en foco. Para este
tipo de aplicaciones se recomiendan RAID5, RAID50, RAID6 o RAID6-FR.

En caso de que se usen SSD, se recomiendan RAID10, RAID5, RAID50 y RAID6. Por
supuesto, también se puede usar RAID6-FR, pero generalmente el tiempo de
reconstrucción no es un problema con los SSD.

Si planea usar unidades de disco con altas capacidades, elija RAID6 o mejor RAID6-FR para
reducir el tiempo requerido para la reconstrucción.

La cantidad de unidades por grupo RAID influye en el rendimiento, la seguridad de los


datos y el tiempo requerido para las reconstrucciones. Para averiguar la cantidad
recomendada de unidades por grupo RAID, consulte la Guía de diseño básica.

Tenga en cuenta que el ETERNUS usa el caché de su controlador RAID para lecturas y
escrituras. Como esto tiene una gran influencia en el rendimiento general, las restricciones
de rendimiento de los niveles de RAID no se consideran tan altas en entornos donde los
requisitos de rendimiento o la carga promedio en el sistema no son altos.

Unidades de repuesto en caliente (HOT SPARE DRIVES)

Configure siempre las unidades de repuesto en caliente. Los repuestos dinámicos se utilizan como
unidades de repuesto cuando las unidades de un grupo RAID fallan o muestran signos tempranos
de errores.
Hay repuestos dinámicos dedicados que se asignan a un grupo RAID específico y repuestos
dinámicos globales que están disponibles para cualquier grupo RAID siempre que su capacidad sea
suficiente y su tipo de unidad sea apropiado.

Conceptos de almacenamiento de uso especial:

Ahora aprendió los conceptos básicos del concepto SAN. SAN y NAS tienen en común que
siempre hay una instancia que controla el sistema de archivos, ya sea el servidor adjunto o
el almacenamiento en sí. Todos los sistemas de archivos tienen limitaciones en términos
del número máximo de archivos y carpetas. Este no es el único problema.

El sistema de control necesita realizar un seguimiento de los metadatos, qué archivos se


han almacenado y dónde se encuentran. En cierto punto, el sistema gasta la mayoría de
sus recursos para indexar esta información y el rendimiento general del almacenamiento
cae drásticamente.

Los clientes con la necesidad de almacenar miles de millones de archivos tendrían que
separar las aplicaciones y mantener diferentes sistemas de archivos para superar esta
limitación. Como esto no es aceptable, se ha introducido el almacenamiento de objetos.
Ceph es una de las soluciones de almacenamiento de objetos más importantes. Con Ceph,
los datos no se almacenan en forma de bloques de datos o archivos, sino en objetos. Estos
objetos pueden contener datos de la aplicación, atributos de archivo, metadatos y
funciones relacionados con el contenido y son paquetes de información. Ceph usa una
jerarquía muy plana que no usa carpetas y subdirectorios.

Los metadatos no se almacenan centralmente, pero el cliente que accede puede calcular
la información donde se encuentran los datos. Debido a eso, no se requiere una instancia
central para mantener y controlar estos metadatos.

Además, Ceph puede hacer uso de servidores tradicionales con disco local o unidades
flash. Según las políticas, los objetos se distribuyen a través de una red rápida y dedicada
entre los nodos del servidor.

Si un nodo fallara, los datos se reconstruirían automáticamente en otro nodo. El sistema


de almacenamiento Ceph puede expandirse mediante otros nodos de servidor para lograr
más capacidad o rendimiento. Debido a eso, el sistema se puede ampliar fácilmente.
Cuando los nodos se quedan sin garantía, los nodos del servidor actual se pueden
implementar y los nodos antiguos se pueden sacar de la configuración. Los datos se
redistribuyen automáticamente dentro del grupo Ceph. Debido a eso, un almacenamiento
basado en Ceph no necesitará la migración de datos cuando los nodos lleguen al final de
su vida útil; se puede actualizar y mantener en el hardware actual sin problemas.
Ceph es ideal para entornos con una tasa de crecimiento de datos impredecible o una
cantidad impredecible de archivos. Esto podría ser servicios en línea donde los usuarios
pueden cargar tantos archivos como quieran. Piense en aplicaciones como Flickr,
Facebook o Dropbox, por ejemplo. También las compañías de medios almacenan grandes
cantidades de imágenes y videos. Si fuera necesario un mayor rendimiento, se podrían
agregar fácilmente más nodos de servidor.

Ceph también es adecuado como destino para soluciones de archivo, aplicaciones de


Internet de las cosas o como almacén de datos para análisis de Big Data. También se
puede usar como un almacenamiento rentable para entornos de nube basados en
OpenStack.

Fujitsu ofrece la arquitectura de referencia del ETERNUS CD10000 como una


implementación de Ceph. Ceph es una solución de código abierto, pero con el CD10000
los clientes no necesitan renunciar al soporte profesional.

Otro enfoque para almacenar datos es el almacenamiento en cinta. Fujitsu ofrece la serie
ETERNUS LT que contiene bibliotecas de cintas que comienzan con el ETERNUS LT20 que
admite una sola unidad de cinta y 8 ranuras para cintas y termina con el ETERNUS LT260,
que puede equiparse con hasta 42 unidades de cinta y hasta 560 ranuras de cinta.

Si se requiere un mayor escalado, la cartera de bibliotecas de cintas de Fujitsu también


contiene la serie Quantum Scalar y la serie Oracle SL.

El único inconveniente del almacenamiento en cinta es que el acceso a archivos


individuales es relativamente lento ya que el contenido de la cinta debe escanearse
secuencialmente. Por otro lado, las cintas son la forma más económica y eficiente de
almacenar datos, lo que las convierte en la solución ideal para el respaldo y el archivo a
largo plazo.

También podría gustarte