Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenidos
1. Plataformas de altas prestaciones para Inf. Grfica. Modelos de programacin. 2. Metodologa de diseo de Algoritmos paralelos 3. Programacin de arquitecturas paralelas convencionales 4. Programacin de GPUs
6 de abril de 2011 Jos Miguel Mantas Ruiz 1
SISD
nico flujo de datos (Single Data)
Monoprocesadores
UI EP M
MISD
No se usa
SIMD
Mltiples flujos de datos (Multiple Data)
MIMD
EP M M M - Proc. Multicore - Multiprocs.
. . .
. . .
UI UI UI
EP EP EP
M M M
UI
EP EP
- Clusters de ordenadores
6 de abril de 2011
240 cores 30 multiprocesadores cada uno con 8 cores, una unidad de doble precisin y memoria compartida de 16KB.
6 de abril de 2011
6 de abril de 2011
CPU y GPU actan como dispositivos separados, cada uno mantiene su propia memoria DRAM
HOST
DEVICE
GPU
CPU
PCI-E
DRAM
6 de abril de 2011 Jos Miguel Mantas Ruiz
DRAM
6
6 de abril de 2011
GPU
Modelo de Hardware: Varios Multiprocesadores SIMD con memoria compartida. Modelo de Ejecucin basado en ejecucin multihebra de grano fino con varios niveles de memoria.
UI
Memoria compartida
DRAM
Multiprocesador N
1.3. Multiprocesadores
Espacio de direcciones nico Fcil programar con datos compartidos: Clasificacin dependiendo de la localizacin de la memoria ppal
UMA (Uniform Memory Access) o SMPs (Symmetric MultiProcessors)
Difcil aumentar el n de procesadores: mx. 16.
M .
Memoria compartida 9
Productividad
P P P P
10
6 de abril de 2011
Hebra maestra
Hebra maestra
F O R K
J O I N
Regin paralela
Hebra maestra
6 de abril de 2011
11
1.4. Multicomputadores
Conexin de ordenadores completos mediante una red de interconexin Clusters de ordenadores
Cada ordenador con su memoria local y su propio espacio de direcciones Red de interconexin:
envo/recepcin de mensajes.
P ro c e s a d o r 0 P ro c e s a d o r 1
Red de Interconexin
M e m o r ia R ed d a to
M e m o ria d a to
s e n d (d a to s )
r e c e iv e ( d a to s )
- Ms difcil programar explcitamente con paso de mensajes - No se necesitan mecanismos de Exclusin mutua - Mejor escalabilidad que multiprocesadores - Aplicable a redes de ordenadores: Mayor flexibilidad y adaptacin a los avances tecnolgicos
6 de abril de 2011 Jos Miguel Mantas Ruiz 12
P0
P1
6 de abril de 2011
13
CPU multicore
GPU
CPU multicore
Gigabit Ethernet Switch
PCI-E
GPU
Nodo 2
Nodo 3 PCI-E
CPU multicore
6 de abril de 2011
GPU
CPU multicore
Jos Miguel Mantas Ruiz
PCI-E
GPU
15