Está en la página 1de 65

CAPACITACIÓN EN VENTAS DE EMC

Conceptos básicos de
almacenamiento

Capacitación en ventas de EMC

EMC Education Services

ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 1
Objetivos de aprendizaje

Al finalizar este curso, usted podrá:

 Explicar la manera en que ha evolucionado el almacenamiento en el


tiempo
 Describir los aspectos básicos de los entornos de almacenamiento
actuales
 Identificar los principios fundamentales de la arquitectura
y rendimiento del almacenamiento

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 2


CAPACITACIÓN EN VENTAS DE EMC

Una breve historia de discos


Diapositiva de sección: ejemplo 2
y cintas

Esta sección cubre la historia de los discos y las cintas.

EMC Education Services

ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 3
Uso del mainframe en los
buenos viejos tiempos

 Hace mucho tiempo, las aplicaciones se denominaban programas


 Éstos eran colocados en el mainframe a través de orificios perforados
 La salida solía ser en papel (impreso o perforado)
 La vida era binaria... todo era blanco o negro

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 4


El dispositivo de cinta magnética

 La cinta se introdujo en 1952, como una mejor alternativa de las tarjetas perforadas
 La cinta:
– Tenía mucha más capacidad que una caja de tarjetas perforadas
– Era mucho menos frágil que una tarjeta perforada
– Era mucho más rápida que leer un montón de tarjetas perforadas
 Pero era demasiado lenta para satisfacer las
necesidades de las aplicaciones emergentes
 La cinta es secuencial
– Debe leerse toda la cinta hasta encontrar la información deseada
– La ley de Murphy siempre garantiza que:
 Los datos se encuentran al final de la cinta actual
 En una cinta distinta o
 En una cinta que no puede leerse

 Había que encontrar un enfoque más eficiente


– Dispositivos de almacenamiento de acceso directo (DASD)

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 5


Primeros dispositivos de
almacenamiento en disco para
computadoras: 1954

Los primeros dispositivos de El diseño de tambores fue luego


almacenamiento de acceso directo eran mejorado por la tecnología
“tambores” giratorios cubiertos con un “Winchester”, que utilizaba
revestimiento magnético y varios cabezales movibles y platos planos
cabezales de lectura/escritura fijos.
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 6
El disco

 Inventado a principios de la década del 50


 Platos de aluminio con revestimiento magnético en cada lado
 Los platos se ensamblaban en “paquetes”
 Cabezales de lectura/escritura movibles para acceder a los datos de
cada plato

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 7


La unidad de disco y el eje

 Los platos giraban alrededor de un asta central llamada eje


 La palabra eje aún se utiliza para hacer referencia a la unidad de
disco individual

Platos
Eje
El mecanismo
activador
El mecanismo activador
mueve los cabezales
de lectura/escritura

Cabezal de lectura/escritura
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 8
Ven a volar conmigo

 Los cabezales de lectura/escritura literalmente vuelan en la corriente


de aire generada por el disco giratorio

– Al igual que un avión vuela en las corrientes generadas por su empuje


hacia adelante

Cabello humano
0.007 centímetros
de diámetro Partícula de polvo
0.00381 centímetros
Altura de vuelo 1.18-
2.75 millonésimas
de un centímetro Medios de grabación

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 9


Los beneficios del DASD

 La capacidad de un disco de acceder a los datos en forma aleatoria


aumentó de forma significativa el rendimiento del mainframe
 Una cinta podía tardar minutos en acceder a una información en
particular, mientras que el disco podía hacerlo en segundos
 Esto significaba que la cantidad de transacciones que podía ejecutar
un mainframe o un servidor en un tiempo determinado, se veían
incrementadas si se utilizaba un disco

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 10


Evolución de la tecnología
de disco
 Las capacidades de los discos siguen creciendo en
forma significativa a partir del aumento de la densidad
de los datos
– La Grabación longitudinal se ve limitada por el efecto Superparamagnético (SPME)
– Actualmente se está produciendo la Grabación perpendicular (10x)

 Tendencias de rendimiento
– Aumento de la velocidad de RPM
– Aumento del uso de la memoria y del caché a nivel de disco
– Discos de estado sólido (flash)

 Interfaces de unidad de disco dirigidas por


estándares industriales
– Ultra SCSI
– Fibre Channel (Óptico)
– SATA, PATA (EIDE)

 Desafío del sector


– La mayor capacidad por disco reduce el costo, pero…
– Reduce la cantidad de mecanismos activadores para una capacidad determinada
– I/O por vector activo... inactivo para densidades mayores de dispositivos mecánicos

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 11


CAPACITACIÓN EN VENTAS DE EMC

Aspectos fundamentales del


Diapositiva de sección: ejemplo 2
rendimiento del disco

Esta sección cubrirá los aspectos fundamentales del rendimiento


del disco.

EMC Education Services

ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 13
¿Cómo se formatea un disco?

Pista El plato del disco está segmentado en


un número de anillos concéntricos
denominados pistas

Las pistas de la misma posición de


todos los platos del disco en un eje
Cilindro forman un cilindro
Las pistas se seleccionan por número
de cabezal
Sector Cada pista del plato del disco también
se segmenta en secciones individuales
llamadas sectores
Una zona unívocamente identificable
dentro de un disco se determina por
cilindro, cabezal y sector
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 14
Selección del disco correcto
(existen muchos)

 Rendimiento (también llamado Tiempo de acceso):


– Qué tan rápido pueden moverse los cabezales hasta la pista correcta
– Qué tan rápido pueden moverse los datos fuera y dentro del disco
 Esto se explicará en las diapositivas siguientes

 Capacidad
– Qué cantidad de datos puede almacenar el disco
 Observemos los parámetros de rendimiento
– Los factores que diferencian el comportamiento del disco

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 15


Tiempo de acceso de la
unidad de disco

Tiempo de búsqueda:
El tiempo promedio necesario para
mover el brazo del mecanismo activador
para posicionar el cabezal de
lectura/escritura sobre la pista

Los primeros discos eran de 14” (35 cm)


de diámetro y tenían amplios tiempos de
búsqueda
¡50ms!
Los discos modernos son de 3 ½” (9 cm)
o 2 ½” (6 cm) y tienen tiempos de
búsqueda mucho más pequeños
3 - 4ms

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 16


Tiempo de acceso de la
unidad de disco, parte 2

Latencia:
La cantidad de tiempo promedio que hay
que esperar para que los datos lleguen
debajo del cabezal de lectura/escritura
a medida que gira el disco

También se denomina demora rotacional


Mientras más rápido gire el disco,
menor será la latencia

Los primeros discos giraban a 2.400 RPM

Los discos modernos giran a:


5,400 – 15,000 RPM

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 17


Tiempo de acceso de la
unidad de disco, parte 3

Velocidad de la transferencia:
La cantidad de datos que pueden
escribirse o leerse en un período
de tiempo dado (generalmente se
expresa en bytes por segundo)

RPM más ágiles y conexiones más


rápidas permiten una transferencia
más rápida

Las velocidades de las


transferencias son más altas en el
extremo exterior del disco

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 18


La llegada del arreglo
de almacenamiento

 Hasta 1984, los sistemas


informáticos de
almacenamiento en
disco se componían de:

 Controlador de
almacenamiento

 Cadena de discos

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 19


Tecnología RAID

Arreglos
redundantes Sistema RAID

de discos Controlador
RAID
económicos
Independiente

Arreglo de discos
Los datos se escriben en discos múltiples
• Para un mejor rendimiento
• Para mejorar la disponibilidad

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 20


El primer grupo RAID:
Universidad de California en
Berkley 1984

Dave Patterson

Garth Gibson

Randy Katz

RAID1 (1989) - Sun 4/280 WS,128 MB DRAM, 4 controladores SCSI


de cadena doble, 28 discos SCSI de 13.335 centímetros con
software de espejeado de disco.
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 21
Guía rápida de RAID

A una configuración de discos RAID se le denomina Grupo RAID

RAID 0: datos fraccionados en todos los discos


A C D
Mejora el rendimiento
B
Cualquier falla de los discos implica la pérdida de los datos

RAID 1: los MISMOS datos espejeados en 2 discos


Mejora el rendimiento y la disponibilidad
A A Puede ser costoso
Puede sobrevivir pese a la pérdida de uno de los discos

RAID 3: datos fraccionados en todos los discos


Se utiliza el elemento de paridad para validación/recuperación
A B C P
Mejora la utilización y disponibilidad de los discos
D E F P
Puede sobrevivir pese a la pérdida de uno de los discos PERO
El único disco de paridad puede provocar cuellos de botella en el rendimiento

RAID 5: datos fraccionados en todos los discos


Se utiliza el elemento de paridad para validación/recuperación
A B C P La paridad se escribe en distintos discos para cada fracción
P D E F Mejora el rendimiento en comparación con RAID 3 (sin cuellos de botella)
Puede sobrevivir a la pérdida de uno de los discos

Datos No se muestran todos los tipos de RAID


La cantidad de discos en un grupo RAID puede exceder de 4 (excepto en RAID 1)
Paridad Se muestran 4 discos sólo a modo de ejemplo
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 22
Resumen RAID

RAID Técnica Aplicación


0 Fraccionado sin paridad Amplio rendimiento de bloque, sin redundancia
1 Discos espejeados Alta disponibilidad y rendimiento e implementación sencilla
0+1 Fracción espejada Alta disponibilidad y rendimiento
Código de Hamming, discos de
2 Amplia disponibilidad de rendimiento de bloque, bajo costo
comprobación múltiple
Fraccionado con disco de comprobación de
3 Amplia disponibilidad de bloque a menor costo
paridad simple
Disco de paridad simple de lectura/escritura Procesamiento de transacciones, alta disponibilidad,
4
independiente alto porcentaje de lecturas
Discos de paridad independientes, Procesamiento de transacciones, alta disponibilidad,
5
lectura/escritura independiente alto porcentaje de lecturas
Discos de paridad independiente múltiples, Procesamiento de transacciones, alta disponibilidad,
6
lectura/escritura independiente alto porcentaje de lecturas

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 23


Lo que realmente les pasó
a los dinosaurios...

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 24


Lo que realmente les pasó a los
dinosaurios... (continuación)

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 25


Beneficios de RAID
y algunas desventajas

 El enfoque logró que el almacenamiento fuera más barato y confiable


– Se podían usar unidades de disco de "productos comunes" en lugar de aquellos
costosos y de propiedad exclusiva específicos de fabricantes individuales
– RAID protegía contra la pérdida de datos cuando fallaba un disco
 Excepto RAID 0, que sólo mejora el rendimiento

 Muchos fabricantes adoptaron la tecnología y se disponía de


muchos productos
– Con el tiempo esto incrementó la confusión
 Diferentes tipos de servidores
 Diferentes sistemas operativos
 Diferentes aplicaciones
 Diferentes enfoques administrativos
 Y ahora diferentes arreglos de almacenamiento

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 26


Evolución del arreglo
de almacenamiento

Mainframe/Servidor

Interfaz del host Interfaz del host

Memoria caché
con tolerancia a fallas

Controlador Controlador
del arreglo del arreglo

Directores de disco Directores de disco

Discos en grupos RAID


INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 27
CAPACITACIÓN EN VENTAS DE EMC

Redes de almacenamiento:
Diapositiva de sección: ejemplo 2
SAN, NAS y iSCSI

Esta sección cubre las redes de almacenamiento: SAN, NAS y iSCSI.

EMC Education Services

ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 29
Septiembre de 1977:
comienzos de la red

ARCNET se inventó para conectar


computadoras entre sí a fin de
intercambiar información

La tecnología sería la base de la Red


de área local y del almacenamiento
conectado a la red
John Murphy era el arquitecto Gordon Peterson (que odia
en jefe de ARCnet a los peluqueros, escribió el
sistema operativo de ARCnet)
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 30
Evolución de las conexiones

Bus/etiqueta de disco de mainframe:


8lbs/metro

Cable SCSI: 8oz/metro

CAT6/Cable de fibra óptica >1 oz/metro


INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 31
¿Qué es un almacenamiento
conectado en red (NAS)?

…Una red transportando tráfico de archivos

RED IP

Switches
de LAN

Usuarios/Clientes Servidores/Aplicaciones Almacenamiento/


de la aplicación Datos del archivo

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 32


NAS

NAS
Equipo de
escritorio del Servidor
usuario Oracle
Almacenamiento

NIC
NIC
conectado en red

Tarjeta de interfaz de red


Red IP
Enrutador o switch
Almacenamiento o servidor
Ideal para: Dispositivo Dispositivo
 Compartir archivos y algunas de uso de uso
aplicaciones compartido compartido
 Costos de adquisición y conectividad de archivos de archivos
 Fácil de usar, implementación simple
 Conectividad a larga distancia Datos almacenados como archivos
en file systems
No es ideal para:
 Rendimiento de aplicaciones high-end
 Soporte de aplicaciones de Microsoft
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 33
¿Qué es una red de
almacenamiento (SAN)?

…Una red dedicada que transporta tráfico de almacenamiento


basado en bloques

NETWORK
Fibre Channel

Directores
de switches SAN

Servidores/Aplicaciones Almacenamiento/Datos
de la aplicación
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 34
SAN

SAN
Servidor de Servidor de
Aplicaciones Aplicaciones

Red de

HBA

HBA

HBA

HBA
almacenamiento

Tarjeta HBA
Cableado de Fibre Channel
Switch o director
Arreglo de almacenamiento
0 1 2 3
Ideal para: Memoria
Arreglo 0 1 2 3
Arreglo
Memoria caché espejeada
caché
 Rendimiento de la aplicación espejeada
 La más alta disponibilidad
 Consolidación a larga escala
Los datos se almacenan como
No es ideal para: bloques y volúmenes
 Costo de adquisición y conectividad para una pequeña
cantidad de servidores
 Conocimiento especial necesario para administrar
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 35
¿Por qué todo este alboroto alrededor
del almacenamiento IP (iSCSI)?

Infraestructuras SAN consolidadas Infraestructura NAS


iSCSI amplía los consolidada

beneficios de
consolidación del
SAN a servidores
y almacenamiento
“anclados”

Implementaciones de almacenamiento con conexión directa


iSCSI aumenta mis
capacidades de
iSCSI ofrece una
consolidación para
infraestructura de
incluir aplicaciones
almacenamiento IP
en bloque
rentable para mi SAN
tradicionales
de nivel de entrada

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 36


La SAN de almacenamiento
IP (iSCSI)

Servidor de Servidor de
Aplicaciones Aplicaciones

iSCSI Driver iSCSI Driver iSCSI

NIC

NIC
NIC
Red IP
Enrutador o switch
Almacenamiento u otro dispositivo
Ideal para:
 Consolidación de almacenamiento Dispositivo Dispositivo
 Costo de adquisición/Costo de conectividad iSCSI de destino iSCSI de destino
 Facilidad de uso, implementación sencilla
 Capacidad de utilizar las redes existentes
 Conectividad en el campo Los datos se almacenan
como bloques y volúmenes
No es ideal para:
 Rendimiento de aplicaciones high-end
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 37
¿Cómo se construyen
entornos consolidados?
SAN, iSCSI y NAS

SAN Fibre Channel SAN IP NAS

Servidores de aplicaciones Servidores de aplicaciones Servidores de aplicaciones

Host A Host B Host A Host B Host A Host B


NIC NIC
HBA HBA NIC NIC

I/O de archivos
I/O de Bloque

I/O de Bloque

Network
Fibre Red IP Red IP
Channel

Se comparte el Se comparte el
almacenamiento almacenamient
físico, no o físico de
la información la información

NAS consolida los file servers


El SAN consolida el almacenamiento y el almacenamiento…
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 38
Juntando todo

RED IP

Switches
de LAN

Usuarios/Clientes Servidores/Aplicaciones Almacenamiento/


de la aplicación Datos del archivo
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 39
Juntando todo

NETWORK
Fibre Channel

Directores
de switches SAN

Servidores/Aplicaciones Almacenamiento/Datos
de la aplicación

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 40


Juntando todo

Directores de
switches SAN

Gateway
RED IP NETWORK
Fibre Channel

Switches
de LAN

Usuarios/Clientes de Servidores/Aplicaciones Almacenamiento/


la aplicación Datos del archivo
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 41
¿Cuántos clientes aún se
ven así?
Transferencias de archivos AIX a
Extracciones de base de datos HP/UX vía Platinum 9.9
RS6000 a Red Hat mediante MQ 4.4 FTP entre Sun y NT
Red
IBM RS/6000, SP2 HP 3000, K460
Sun Enterprise TM TM AIX 4.1, 4.2, 4.3 HP-UX 10, 11.0, 11.2, MPE
Servidor/sistema Sun ULTRASPARC DB2/6000 Sybase 11.9, 12
operativo LINUX Solaris 3.2, 3.4, 3.5 TM TM
Red Hat Oracle 7.5, 8.0
Fujitsu DS90 UX
P/M Compaq Proliant 2500
Base de datos Apache Proliant 5500
NT 3.5, 4.0
Batch CAD/CAM Inventario PeopleSoft
Financials Lotus
comercio Exchange Notes
Aplicación OLTP. electrónico

Almacena ATL Cinta DK


miento Primera etapa de Legato a DLT
respaldo Respaldo por Cheyenne
tar: 8mm ADSM a 4mm OmniBack
Respaldo a 3490s

Prueba

Recuperación
de desastres

Proactivo
Proactivo Reactivo
Reactivo Proceso
Proceso cíclico
cíclico

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 42


La consolidación del
almacenamiento disminuye
el TCO
Compaq
Sun Prolaint 7000
Enterprise Xeon
Solaris 7 NT 4.0-SP4
LINUX Red Oracle 8.i
Hat HP T520
HP-UX 11.0
Oracle 8.i HP T520
HP-UX 11.0
Oracle 8.i

Un plan de D/R para


las grandes Administración
empresas consolidada

BCV
BCV Respaldo y
Volúmenes reusables restauración
para pruebas, etc. consolidados

Proactivo Reactivo
Reactivo
Proactivo Proceso
Proceso cíclico
cíclico

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 43


Administración del
almacenamiento

Antes  ¿Recopilación de datos de


múltiples fuentes?
SAN  ¿Información incompleta y no
relacionada?
??  ¿Distintas tareas y herramientas
?
para cada proveedor?
NAS
 ¿Complejidad y consumo
de tiempo?
 ¿Suposiciones y errores?
DAS

Después
Vista consistente del
Administración del
entorno de
almacenamiento
almacenamiento
Networked
storage  Planear y aprovisionar
 Monitorear e informar
 Administración de dispositivos
72% 81%
utilización utilización
78% 60%
utilización utilización
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 44
CAPACITACIÓN EN VENTAS DE EMC

Replicación, respaldo
yDiapositiva
recuperacióndede sección:
datos ejemplo 2

Esta sección cubrirá la replicación, respaldo y recuperación de datos.

EMC Education Services

ORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN © Copyright EMC Corporation. Todos los derechos reservados. Ver.030710 46
Copias locales de los datos:
clones

 Copias de punto en el tiempo


Copias de imágenes
físicamente independientes del completas
volumen de origen
– Impacto mínimo en el rendimiento
para las aplicaciones
– Ideal para
BCV
 Respaldo BCV
 Recuperación BCV
BCV
 Pruebas BCV
 Extracción de bases de datos BCV
 Fuente de datos que debe moverse BCV
BCV
 También se denomina Business
Continuance Volumes (BCV)
 Costo significativo si se necesitan Clon
muchos clones Información sobre
producción
– La capacidad de clonación debe
igualar a la capacidad de producción

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 47


Copias locales de los datos:
snapshots

 Copias lógicas de los datos de punto en el tiempo


 Copia de los datos basada en puntero Vista lógica de punto en el tiempo
– Tendrá cierto impacto en el rendimiento de las
aplicaciones
– Ideal para snapshot
 Respaldo snapshot
 Recuperación snapshot
snapshot
 Pruebas snapshot
 Administración de cambio de datos con el paso snapshot
del tiempo snapshot
 Menos costoso que los clones snapshot

– Suele necesitarse un 20% de la capacidad Snaps


de producción hot

– 2 GB de capacidad de producción sólo necesitarían Información


400 MB de espacio para snapshots sobre
producción
 El almacenamiento NAS suele utilizar snapshots
y no clones

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 48


Replicación remota

 Objetivo de punto de recuperación (RPO)


– ¿Qué tan antiguos deben ser los datos que debemos recuperar en caso de una
pérdida de datos?
 Objetivo de tiempo de recuperación (RTO)
– ¿Cuánto tiempo debe pasar después de un incidente de pérdida de datos antes de
que las operaciones vuelvan a funcionar?

RPO: Objetivo de punto de Sistema caído RPO: Objetivo de tiempo de


recuperación debido a un desastre recuperación (RTO)

Semanas Días Horas Minutos Minutos Horas Días Semanas

tiempo

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 49


Modelo síncrono

2
I/O
1
I/O ACK
3
4
ACK

1. I/O desde el host al sistema de almacenamiento local


2. I/O desde el sistema de almacenamiento local al sistema
remoto (destino)
3. Reconocimiento desde el sistema remoto al sistema local
4. Reconocimiento desde el sistema de almacenamiento local al host
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 50
Replicación asíncrona con
actualización periódica
4
3 Delta set

Chunk
1
I/O ACK

5
2
ACK

1. I/O del host al sistema de almacenamiento


2. Reconocimiento desde el sistema de almacenamiento
local al host
3. Evento desencadenador
4. Delta Sets desde el sistema de almacenamiento local al
sistema remoto (destino)
5. Reconocimiento desde el sistema remoto al local
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 51
El problema con el respaldo

 El tiempo permitido para el respaldo se denomina “ventana de respaldo”

 Los requisitos de mayor disponibilidad de aplicaciones hacen que la


ventana se achique

 La cantidad de datos del usuario aumenta


– Así que aumenta también la cantidad de datos que deben respaldarse

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 52


Respaldo y recuperación
mediante cintas

Arquitectura básica
Características
• Una forma muy común de
Clientes
heterogéneos respaldo/recuperación
Aplicaciones – Se pueden conectar unidades individuales
clave de cinta a cada servidor
– El respaldo puede realizarse sobre
la LAN
▪ Lento y susceptible a errores, pero económico
LAN
– El respaldo también puede realizarse sobre
Servidor de
la SAN
respaldo ▪ Rápido pero costoso
– Se puede utilizar una librería de cintas de
NAS algún tipo
Nodo de –
(NDMP) almacenamiento A medida que aumenta la información,
también lo hace la cantidad de cintas,
SAN y esto puede tornarse costoso y difícil
de administrar
– La seguridad es fundamental porque se
Librería pueden perder o extraviar las cintas
de cintas – La cinta es ligeramente frágil y se daña
cuando se traslada de un lugar a otro

Problema: El respaldo en cinta puede ser rápido pero la recuperación siempre es mucho más lenta
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 53
Respaldo y recuperación

mediante discos
Del respaldo a la arquitectura Características
del disco • Una forma cada vez más común
Clientes
heterogéneos de respaldo/recuperación
Aplicaciones
clave – El destino del respaldo pueden ser
grandes unidades ATA dentro del
arreglo de almacenamiento
▪ Puede ser el mismo arreglo de
LAN almacenamiento utilizado por el
entorno de producción
– El destino del respaldo puede ser una
Servidor
de librería de cintas virtuales
respaldo ▪ Es un arreglo de almacenamiento con
NAS Nodo de emulación de hardware y software
almacenamiento ▪ Soporte simultáneo para múltiples
SAN
unidades y librerías de cinta
– Una librería de cintas virtual tiene el
aspecto de “algo real” para la
Respaldo
de disco aplicación de respaldo
Librería de destino – La librería de discos de EMC ofrece
de cintas
replicación remota para tener una
mejor disponibilidad de los respaldos

Solución: La recuperación del disco es tan rápida como el respaldo y mucho mejor
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 54
El problema con el respaldo

 Pueden utilizarse clones y snapshots para el respaldo


– Esto realmente ayuda a mejorar la disponibilidad de aplicaciones
 Pero la cantidad de datos aumenta y todo se vuelve más grande
– Más almacenamiento
– Más cintas
– Más personas que administren todo el sistema

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 55


¿Por qué la deduplicación
de datos?

Tendencias más importantes que influencian en la transformación


de los entornos de respaldo
 Crecimiento de los datos
– La producción crecerá en 5x,
Información digital que se crea y se replica en todo el
 el respaldo representa 30x de la capacidad mundo
de producción
2,500
– Se mantienen respaldos completos diarios,
semanales y mensuales durante meses o años Se quintuplicó en cuatro años
2,000
 Virtualización del servidor
– La expansión de VM genera desafíos 1,500
de protección

Exabytes
– La consolidación del servidor deja muy poco 1,000
ancho de banda para el respaldo
 los respaldos convencionales suelen mover 500
más del 200% de los datos semanalmente
 Centro de datos virtual de última generación 0
– Modelos de "TI como servicio” generan mayor 2008 2009 2010 2011 2012
disponibilidad y flexibilidad de recursos
– Exigen ventanas de respaldo y RTO/RPO Fuente: Informe de IDC Digital Universe, patrocinado por EMC, mayo de 2009

mucho menores

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 56


El respaldo está evolucionando

Arquitectura de Clientes de Administrador Almacenamiento Almacenamiento


respaldo/ respaldo de de medios/ de respaldo de recuperación
recuperación aplicaciones respaldo en sitio de desastres

Software Cinta Cinta


Cinta
de respaldo
Convencional
(centrado en cinta)
Software VTL VTL/cinta
VTL VTL/cinta
de respaldo

Software Almacenamiento
de respaldo con deduplicación
Transformacional
(centrado en disco)

Software y sistema de respaldo con deduplicación


VM

en las instalaciones fuera de las


instalaciones
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 57
Definición de deduplicación
de EMC

Conjunto de
datos 1

Deduplicación
Conjunto de
datos 2

Conjunto de
datos 3

Antes: Después:
segmentos totales = 39 Segmentos exclusivos = 6
INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 58
Resultados reales de
la deduplicación

Los resultados varían según el tipo de datos:


Tasas del cliente frente a respaldos completos

Cantidad de Cantidad
datos primarios de datos Coeficiente de
de los que se ha transferidos de deduplicación
Tipo de datos hecho respaldo manera diaria diaria
File systems de Windows 3,573 GB 6.1 GB 586:1

Combinación de file systems de UNIX,


5,097 GB 11.7 GB 436:1
Linux y Windows

Diseño de archivos en NAS (Respaldo


3,265 GB 24.2 GB 135:1
de tipo NDMP)

Mezcla de 20% de bases de datos y 9,583 GB 80.0 GB 120:1


80% de file systems (Windows y UNIX)

Combinación de bases de datos y file


7,831 GB 104.2 GB 75:1
systems de Linux

Fuente: EMC

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 59


Utilización de unidades de
respaldo de última generación

Antiguo paradigma Nuevo paradigma


Entorno físico: Baja utilización Entorno virtual: Gran utilización
general del servidor y uso amplio general del servidor y poco uso del
del ancho de banda para el ancho de banda para el respaldo
respaldo
100%
100%

80%
80%
Utilización del CPU

Utilización del CPU


60%
60%

40% Servidor ESX


40%

20%
20%
Hardware

0%
0%
Recursos físicos compartidos
Servidor A Servidor B Servidor C
Servidor virtual A Servidor virtual B Servidor virtual C

Utilización de recursos del 20% Utilización de recursos del 80%

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 60


Respaldo de última generación:
panorama general

File systems Virtual


Deduplicación Deduplicación

Recuperación
de servidores Deduplicación

Calendarización,
Cinta políticas e informes Nube

Administración centralizada
MSFT Soporte avanzado Centro de datos
Oracle
de aplicaciones y sistema remoto

SAP
Aplicaciones Sites remotos

Deduplicación Snapshots, CDP y CRR Deduplicación

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 61


Resumen del curso

Durante este curso, ha aprendido a:

 Explicar la manera en que ha evolucionado el almacenamiento


en el tiempo

 Describir los aspectos básicos de los entornos de


almacenamiento actuales

 Identificar los principios fundamentales de la arquitectura


y rendimiento del almacenamiento

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 63


Comentarios acerca del curso

Haga clic aquí para enviar


sus comentarios

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 64


Fin del curso

INFORMACIÓN CONFIDENCIAL DE EMC – SÓLO CON FINES DE CAPACITACIÓN 65

También podría gustarte