Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos básicos de
almacenamiento
ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 1
Objetivos de aprendizaje
ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 3
Uso del mainframe en los
buenos viejos tiempos
La cinta se introdujo en 1952, como una mejor alternativa de las tarjetas perforadas
La cinta:
– Tenía mucha más capacidad que una caja de tarjetas perforadas
– Era mucho menos frágil que una tarjeta perforada
– Era mucho más rápida que leer un montón de tarjetas perforadas
Pero era demasiado lenta para satisfacer las
necesidades de las aplicaciones emergentes
La cinta es secuencial
– Debe leerse toda la cinta hasta encontrar la información deseada
– La ley de Murphy siempre garantiza que:
Los datos se encuentran al final de la cinta actual
En una cinta distinta o
En una cinta que no puede leerse
Platos
Eje
El mecanismo
activador
El mecanismo activador
mueve los cabezales
de lectura/escritura
Cabezal de lectura/escritura
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 8
Ven a volar conmigo
Cabello humano
0.007 centímetros
de diámetro Partícula de polvo
0.00381 centímetros
Altura de vuelo 1.18-
2.75 millonésimas
de un centímetro Medios de grabación
Tendencias de rendimiento
– Aumento de la velocidad de RPM
– Aumento del uso de la memoria y del caché a nivel de disco
– Discos de estado sólido (flash)
ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 13
¿Cómo se formatea un disco?
Capacidad
– Qué cantidad de datos puede almacenar el disco
Observemos los parámetros de rendimiento
– Los factores que diferencian el comportamiento del disco
Tiempo de búsqueda:
El tiempo promedio necesario para
mover el brazo del mecanismo activador
para posicionar el cabezal de
lectura/escritura sobre la pista
Latencia:
La cantidad de tiempo promedio que hay
que esperar para que los datos lleguen
debajo del cabezal de lectura/escritura
a medida que gira el disco
Velocidad de la transferencia:
La cantidad de datos que pueden
escribirse o leerse en un período
de tiempo dado (generalmente se
expresa en bytes por segundo)
Controlador de
almacenamiento
Cadena de discos
Arreglos
redundantes Sistema RAID
de discos Controlador
RAID
económicos
Independiente
Arreglo de discos
Los datos se escriben en discos múltiples
• Para un mejor rendimiento
• Para mejorar la disponibilidad
Dave Patterson
Garth Gibson
Randy Katz
Mainframe/Servidor
Memoria caché
con tolerancia a fallas
Controlador Controlador
del arreglo del arreglo
Redes de almacenamiento:
Diapositiva de sección: ejemplo 2
SAN, NAS y iSCSI
ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 29
Septiembre de 1977:
comienzos de la red
RED IP
Switches
de LAN
NAS
Equipo de
escritorio del Servidor
usuario Oracle
Almacenamiento
NIC
NIC
conectado en red
NETWORK
Fibre Channel
Directores
de switches SAN
Servidores/Aplicaciones Almacenamiento/Datos
de la aplicación
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 34
SAN
SAN
Servidor de Servidor de
Aplicaciones Aplicaciones
Red de
HBA
HBA
HBA
HBA
almacenamiento
Tarjeta HBA
Cableado de Fibre Channel
Switch o director
Arreglo de almacenamiento
0 1 2 3
Ideal para: Memoria
Arreglo 0 1 2 3
Arreglo
Memoria caché espejeada
caché
Rendimiento de la aplicación espejeada
La más alta disponibilidad
Consolidación a larga escala
Los datos se almacenan como
No es ideal para: bloques y volúmenes
Costo de adquisición y conectividad para una pequeña
cantidad de servidores
Conocimiento especial necesario para administrar
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 35
¿Por qué todo este alboroto alrededor
del almacenamiento IP (iSCSI)?
beneficios de
consolidación del
SAN a servidores
y almacenamiento
“anclados”
Servidor de Servidor de
Aplicaciones Aplicaciones
NIC
NIC
NIC
Red IP
Enrutador o switch
Almacenamiento u otro dispositivo
Ideal para:
Consolidación de almacenamiento Dispositivo Dispositivo
Costo de adquisición/Costo de conectividad iSCSI de destino iSCSI de destino
Facilidad de uso, implementación sencilla
Capacidad de utilizar las redes existentes
Conectividad en el campo Los datos se almacenan
como bloques y volúmenes
No es ideal para:
Rendimiento de aplicaciones high-end
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 37
¿Cómo se construyen
entornos consolidados?
SAN, iSCSI y NAS
I/O de archivos
I/O de Bloque
I/O de Bloque
Network
Fibre Red IP Red IP
Channel
Se comparte el Se comparte el
almacenamiento almacenamient
físico, no o físico de
la información la información
RED IP
Switches
de LAN
NETWORK
Fibre Channel
Directores
de switches SAN
Servidores/Aplicaciones Almacenamiento/Datos
de la aplicación
Directores de
switches SAN
Gateway
RED IP NETWORK
Fibre Channel
Switches
de LAN
Prueba
Recuperación
de desastres
Proactivo
Proactivo Reactivo
Reactivo Proceso
Proceso cíclico
cíclico
BCV
BCV Respaldo y
Volúmenes reusables restauración
para pruebas, etc. consolidados
Proactivo Reactivo
Reactivo
Proactivo Proceso
Proceso cíclico
cíclico
Después
Vista consistente del
Administración del
entorno de
almacenamiento
almacenamiento
Networked
storage Planear y aprovisionar
Monitorear e informar
Administración de dispositivos
72% 81%
utilización utilización
78% 60%
utilización utilización
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 44
CAPACITACIÓN EN VENTAS DE EMC
Replicación, respaldo
yDiapositiva
recuperacióndede sección:
datos ejemplo 2
ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 46
Copias locales de los datos:
clones
tiempo
2
I/O
1
I/O ACK
3
4
ACK
Chunk
1
I/O ACK
5
2
ACK
Arquitectura básica
Características
• Una forma muy común de
Clientes
heterogéneos respaldo/recuperación
Aplicaciones – Se pueden conectar unidades individuales
clave de cinta a cada servidor
– El respaldo puede realizarse sobre
la LAN
▪ Lento y susceptible a errores, pero económico
LAN
– El respaldo también puede realizarse sobre
Servidor de
la SAN
respaldo ▪ Rápido pero costoso
– Se puede utilizar una librería de cintas de
NAS algún tipo
Nodo de –
(NDMP) almacenamiento A medida que aumenta la información,
también lo hace la cantidad de cintas,
SAN y esto puede tornarse costoso y difícil
de administrar
– La seguridad es fundamental porque se
Librería pueden perder o extraviar las cintas
de cintas – La cinta es ligeramente frágil y se daña
cuando se traslada de un lugar a otro
Problema: El respaldo en cinta puede ser rápido pero la recuperación siempre es mucho más lenta
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 53
Respaldo y recuperación
mediante discos
Del respaldo a la arquitectura Características
del disco • Una forma cada vez más común
Clientes
heterogéneos de respaldo/recuperación
Aplicaciones
clave – El destino del respaldo pueden ser
grandes unidades ATA dentro del
arreglo de almacenamiento
▪ Puede ser el mismo arreglo de
LAN almacenamiento utilizado por el
entorno de producción
– El destino del respaldo puede ser una
Servidor
de librería de cintas virtuales
respaldo ▪ Es un arreglo de almacenamiento con
NAS Nodo de emulación de hardware y software
almacenamiento ▪ Soporte simultáneo para múltiples
SAN
unidades y librerías de cinta
– Una librería de cintas virtual tiene el
aspecto de “algo real” para la
Respaldo
de disco aplicación de respaldo
Librería de destino – La librería de discos de EMC ofrece
de cintas
replicación remota para tener una
mejor disponibilidad de los respaldos
Solución: La recuperación del disco es tan rápida como el respaldo y mucho mejor
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 54
El problema con el respaldo
Exabytes
– La consolidación del servidor deja muy poco 1,000
ancho de banda para el respaldo
los respaldos convencionales suelen mover 500
más del 200% de los datos semanalmente
Centro de datos virtual de última generación 0
– Modelos de "TI como servicio” generan mayor 2008 2009 2010 2011 2012
disponibilidad y flexibilidad de recursos
– Exigen ventanas de respaldo y RTO/RPO Fuente: Informe de IDC Digital Universe, patrocinado por EMC, mayo de 2009
mucho menores
Software Almacenamiento
de respaldo con deduplicación
Transformacional
(centrado en disco)
Conjunto de
datos 1
Deduplicación
Conjunto de
datos 2
Conjunto de
datos 3
Antes: Después:
segmentos totales = 39 Segmentos exclusivos = 6
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 58
Resultados reales de
la deduplicación
Cantidad de Cantidad
datos primarios de datos Coeficiente de
de los que se ha transferidos de deduplicación
Tipo de datos hecho respaldo manera diaria diaria
File systems de Windows 3,573 GB 6.1 GB 586:1
Fuente: EMC
80%
80%
Utilización del CPU
20%
20%
Hardware
0%
0%
Recursos físicos compartidos
Servidor A Servidor B Servidor C
Servidor virtual A Servidor virtual B Servidor virtual C
Recuperación
de servidores Deduplicación
Calendarización,
Cinta políticas e informes Nube
Administración centralizada
MSFT Soporte avanzado Centro de datos
Oracle
de aplicaciones y sistema remoto
SAP
Aplicaciones Sites remotos