Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CP Sesiones 09-11
CP Sesiones 09-11
Mrida - Venezuela
21 de septiembre de 2009
Computacin Grid
Herbert Hoeger
hhoeger@ula.ve
*Centro de Clculo Cientfico
*Universidad de Los Andes
*EELA-2
Conceptos Preliminares
Supercomputadoras:
Conceptos Preliminares
Hoy en da la distincin ya no es clara ( tabla hasta 1990!).
1000
E
f
i
c
i
e
n
c
i
a
M
F
Supercomputadores
100
Mainframes
10
Microprocesadores
Minicomputadores
1
1965
1970
1975
1980
1985
1990
Conceptos Preliminares
Computacin de Alto Rendimiento: Es aquella que
proporciona un mayor capacidad de cmputo que
la que se puede obtener de computadores
individuales.
Sistemas de memoria compartida.
Sistemas distribuidos.
Clusters.
Mquinas paralelas
En ingls: High Performance Computing o HPC.
Conceptos Preliminares
Computacin Paralela: Es la utilizacin de mltiples
procesadores para resolver una tarea comn.
Se divide el problema es trozos ms pequeos y se
asignan a diferentes procesadores.
CPUs
...
Memorias Locales
...
Bancos de
Memoria
Memoria
Compartida
CPUs
...
...
Dispositivos de
Entrada/Salida
Mecanismo de enrutamiento
Memoria
Distribuida
Conceptos Preliminares
Usamos computacin paralela ya que
Los monoprocesadores limitan:
El rendimiento.
La memoria disponible.
La mquinas paralelas permiten:
Resolver problemas ms grandes.
Resolver problemas ms rpido.
Resolver ms problemas.
Hoy en da HPC es prcticamente computacin
paralela.
Ejemplo: modelado y prediccin climtica.
Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009
Conceptos Preliminares
Computacin Distribuida: Es la utilizacin de
mltiples sistemas, de alguna forma organizada,
para trabajar en un objetivo comn.
Conceptos Preliminares
Computacin Distribuida
Requiere software para la coordinacin de
recursos y tareas.
Computacin paralela / HPC es computacin
distribuida.
Computacin Grid es computacin distribuida.
Conceptos Preliminares
Sistemas Operativos Distribuidos Caractersticas
Transparencia: Provee la visin de una sola
mquina
(mquina virtual)
Acceso: a recursos remotos igual que a locales.
Ubicacin:
Independencia de nombre ubicacin.
Independencia de mquina recurso.
Replicacin: Las replicaciones mejoran el
rendimiento y la disponibilidad el uso, nombre y
control de replicas debe ser transparente.
Conceptos Preliminares
Migracin: por rendimiento, seguridad y
disponibilidad, los objetos (procesos y/o datos)
pueden migrar.
Concurrencia: cada usuario tiene la impresin de
ser el nico usuario as existan muchos.
Escalabilidad: el sistema puede crecer sin
afectar las actividades de los usuarios.
Heterogeneidad: Soportar diferentes tipos de
hardware y software.
Seguridad: Proteccin contra destruccin y usos
no autorizados.
10
Conceptos Preliminares
Disponibilidad: debe operar todo el tiempo an
bajo fallas (quizs con cierta degradacin).
Evitar fallas: usar componentes de calidad.
Tolerar fallas: redundancia de componentes
Detectar y recuperar fallas: usar hardware y software
para descubrir y reparar fallas.
11
Computacin Grid
Los objetivos generales son los mismos que vimos
para sistemas operativos distribuidos pero a un
nivel superior.
Debe operar con distintos sistemas operativos.
Grid
Middleware
Linux A
Solaris
AIX
HPUX
IRIX
Windows Linux B
Mac OS
AIX
12
Computacin Grid
Computacin Grid es computacin distribuida
llevada a un nivel multi-organizacional / multisistemas.
Organizacin
Dpto.
Organizacin
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
Dpto.
13
Computacin Grid
Hoy en da tenemos:
Conectividad global a travs de Internet.
Disponibilidad y confiabilidad en el ancho
de banda.
La velocidad de las redes se duplica cada 9
meses.
14
Computacin Grid
15
Computacin Grid
Caractersticas
Autentificacin
Manejo de Recursos
Polticas de
Balanceo de cargas
Aplicaciones
Autorizacin
Manejo de Fallas
Descubrimiento de
Monitoreo
recursos
Garantizar el
Grid Middleware
Ubicacin de recursos
rendimiento
Acceso a data remota
Deteccin de intrusos
Alta velocidad de
Escalabilidad, etc
Recursos
transferencia de data
16
17
GRID
Equipos homogneos.
Sistema operativo nico.
Administracin y manejo
centralizado - nica.
Equipos estn concentrados.
Objetivo: mejorar el
rendimiento dedicando ms
recursos.
Equipos heterogneos.
Mltiples sistemas operativos.
Administracin y manejo
descentralizado multidominio
Equipos estn dispersos.
Objetivo: mejorar el rendimiento
compartiendo recursos subutilizados en otras partes.
18
Cluster
19
Grid
20
GRID
Foco: HPC.
Ms complicados de usar.
Compartir recursos, datos,
conocimiento y trabajo (a travs
de VO - Virtual Organizations).
Los usuarios aportan a la
infraestructura: comparte/aporta
recursos y podrs tener muchos
ms de lo que podras adquirir
por tu cuenta
21
Tipos de Grid
22
Analoga
23
EL CERN
24
25
63.6
Km
26
63.6
Km
27
63.6
Km
28
29
CERN
30
CERN
1 CD 700 MB
10 PB 14.285.714 CDs
7 CDs 1 cm
10 PB 20,4 Kms de CDs
1 DVD 6,7 CDs
3 Kms de DVDs
Suponiendo los CDs o DVDs llenos!
31
CERN
32
CERN
33
CERN
34
35
Estndares
Si distintas organizaciones deciden implementar un
Grid, es muy probable que cuenten con plataformas
diferentes.
Se hace necesario la utilizacin de estndares para
coordinar eficazmente los recursos a compartir.
36
Estndares
Se ha definido y se esta actualizando un estndar
para las tecnologas Grid:
Open Grid Services Architecture (OGSA)
Este se enfoca en la integracin de servicios a
travs de organizaciones virtuales distribuidas,
heterogneas y dinmicas, para obtener servicios de
calidad utilizando diferentes plataformas.
37
Estndares
OGSA es el producto de personas que pertenecen a
ms de 60 compaas e instituciones de
investigacin, congregadas en una comunidad
virtual de usuarios y desarrolladores denominada
Global Grid Forum (GGF)
http://www.ggf.org
Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009
38
39
40
Estructura de OGSA
Aplicaciones
OGSA
WSRF (Globus Toolkit)
Web Services
ProcesaSeguridad
miento
Servidores
Bases de
Datos
Sistemas
De
Archivos
Almacenamiento
Directorios
Envo de
Mensajes
Redes
41
Componentes de OGSA
Open Grid Services Architecture se fundamenta en
dos tecnologas
Globus Toolkit
Web Services
42
Globus Toolkit
43
Globus Toolkit
Globus Toolkit se encarga de la gestin de:
Seguridad
Descubrimiento de la informacin
Administracin de los recursos compartidos
Administracin de los datos
La comunicacin
Deteccin de fallas
Portatibilidad
Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009
44
Globus Toolkit
45
Globus Toolkit
Los componentes ms relevantes Globus Toolkit que
soportan al OGSA son:
GRAM: Grid Resources Allocation and Management
MDS: Meta Directory Service
GSI: Grid Security Infrastructure
46
Globus Toolkit
47
Globus Toolkit
MDS Proporciona un marco uniforme para el
descubrimiento y acceso a la configuracin de
sistemas.
Supervisa el estado de los sistemas de cmputo, la
disponibilidad de las redes y localizacin de
conjuntos de datos.
48
Globus Toolkit
GSI Se basa en PKI (certificados X.509) y
proporciona servicios de autenticacin nica,
proteccin en las comunicaciones y soporte inicial
en la delegacin.
Este ltimo trmino se refiere a delegar las
credenciales del usuario de forma restringida a los
proxy para que solicite servicios en nombre del
usuario.
49
Cactus Code
50
Finalmente
Que los recursos estn disponibles en
cualquier lugar, en cualquier momento, en
forma confiable y segura, que la ubicacin
de los procesos y datos sea transparente
al usuario, y que el Grid sea fcil de usar,
son metas en las que an se trabaja
arduamente.
La implementacin, operacin y
mantenimiento de un Grid no es fcil,
pero el software esta madurando
rpidamente.
Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009
51