Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alvaro Cuno
23/01/2010
Agenda
GPUs
Cuda
Cuda + OpenGL
GPUs
(Graphics Processing Units)
Supercomputadores
Mapa de los 100 supercomputadores
Fuente http://www.top500.org/
Arquitecturas paralelas
Clusters
Alternativas modernas
Arquitecturas multi-core/many-core
Actualmente 4 cores
Tesla Computing
System
Desktop/GPU
470 GigaFlops
4 TeraFlops SP
Tesla Computing
System
Desktop/GPU
470 GigaFlops
4 TeraFlops SP
Procesamiento
paralelo
para las masas!!!
GPUs
GPUs
1987
2009
10
GPUs
11
GPUs
12
GPUs
2D animation
13
GPUs
GPUs programables
Altamente paralelas
14
GPU
Es un procesador
extremamente potente,
flexible y de bajo costo
15
GPU
Es un procesador
extremamente potente,
flexible y de bajo costo
Originalmente
diseado para
procesamiento grfico
en 3D
Rendering of polygons
Texturing
Shading
16
Computation: 96 GFLOPS
Price: $300*
18
19
GPU: flexibilidad
20
GPU: flexibilidad
21
GPU: flexibilidad
22
23
24
25
Arquitectura simple
26
27
Graphics State
GPU
Shade
Rasterize
Fragments (pre-pixels)
Transform
& Light
CPU
Vertices (3D)
Application
Video
Memory
(Textures)
Render-to-texture
28
Graphics State
GPU
Shade
Rasterize
Fragments (pre-pixels)
Transform
& Light
CPU
Vertices (3D)
Application
Video
Memory
(Textures)
Render-to-texture
29
Aplicaciones recientes
30
Aplicaciones recientes
31
Aplicaciones recientes
32
1ra Gen
rasterization, no
transformations
2da Gen
transformation and
lighting
3ra Gen
Vertex shader,
limited instructions
number, absence of
program flow control,
fixed-point numbers
4ta Gen
5ta Gen
Graphics hardware
for general-purpose
computation
33
Programacin de GPUs
No es muy simple
Cg, GLSL
34
Programacin de GPUs
Arquitecturas de GPUs
Evolucin constante
35
Intensidad aritmtica
Transferencia de datos
Operaciones tpicas
36
30
20
GB/sec
10
Intensidad aritmtica
Pentium4 = 12 Gflops
AI = arithmetic_op/memory_op
38
39
Operaciones tpicas
Map
Reduce
Stream filtering
Sort/Search
Gatter(get) / Scatter(set)
40
64 bits es soportado
41