Documentos de Académico
Documentos de Profesional
Documentos de Cultura
procesadores avanzados
1
Indice
Tipos de paralelismo
Pipeline
Arquitecturas superescalares
Procesadores VLIW
Jerarqua de memoria
Principios de localidad y tipos de memoria cach
Polticas de reemplazo
Polticas de escritura
Dispositivos DSPs
Caractersticas y alternativas
2 Seleccin de DSPs y flujo de diseo
Pipeline
Rendimiento de un procesador
3
Tipos de paralelismo
Pipeline ideal
6
Pipeline
Resolucin de conflictos
7
Pipeline
8
Procesadores superescalares
Introduccin
Tipos de procesadores
superescalares
Ejecucin de instrucciones en-orden
Las instrucciones se recogen, ejecutan y completan en el
orden generado por el compilador
Si una instruccin para, el resto para
Las instrucciones se planifican de forma esttica
Procesadores en orden
El valor CPI lmite para procesador escalar con pipeline es 1
El valor CPI lmite para superescalar (pipeline) de N-issues es 1/N
Procesadores en orden
Pipelines con ms issues son posibles.
12
Procesadores superescalares
Paralelismo:
Es posible ejecutar 1 & a la vez y 3 & 4 a la vez
Se pueden paralelizar aquellas instrucciones que no tienen una
dependencia del tipo read-after write (RAW)
En general, si no hay dependencia entre instrucciones, se
13 pueden ejecutar en orden o simultneamente.
Procesadores superescalares
14
Procesadores superescalares
Las Instrucciones no se
pueden reordenar
(Solucin: register renaming)
Las Instrucciones no se
pueden reordenar
15
Procesadores superescalares
4. Ejecutarlas
5. Repetir
16
Procesadores superescalares
Compatibilidad binaria
Si se aaden ms unidades funcionales en una nueva
versin de la arquitectura del procesador o nuevas mejoras
que no modifiquen el juego de instrucciones, los programas
antiguos pueden beneficiarse y el nuevo hardware lo
ejecutar de forma ms eficiente
17
Procesadores superescalares
18
Procesadores VLIW
Introduccin
Las arquitecturas VLIW se basan en la deteccin del paralelismo
en tiempo de compilacin el compilador analiza el programa y
detectas las operaciones que pueden ejecutarse en paralelo
Las instrucciones se empaquetan en conjuntos de
instrucciones
VLIW
La deteccin de paralelismo y el
empaquetamiento de instrucciones
se realiza off-line por el compilador
20
Procesadores VLIW
VLIW
21
Procesadores VLIW
22
Procesadores VLIW
VLIW: ventajas
Hardware ms simple:
El nmero de unidades funcionales puede aumentarse sin
necesidad de aadir hardware adicional que detecte el
paralelismo, como ocurre en los procesadores
superescalares
Menor consumo
VLIW: inconvenientes
Se necesita un gran nmero de registros internos en la CPU para
mantener las unidades funcionales activas (almacenar operados
y resultados).
VLIW: inconvenientes
Cdigo final de mayor tamao, debido a los NOPs introducidos
Incompatibilidad binaria
Si se introducen nuevas unidades funcionales en una nuev
versin del procesador el nmero de operaciones que
pueden ejecutarse en paralelo se incrementa el paquete
de instrucciones cambia el cdigo binario antiguo no es
ejecutable en el Nuevo procesador
25
Jerarqua de memoria
Acceso a la
informacin de
forma eficiente
Maximizar
rapidez/coste
26
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
27
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
28
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Principios de funcionamiento
Localidad temporal: Cuando
se accede a una posicin de
memoria, existe una alta
probabilidad de volver a
acceder a esa posicin en un
futuro cercano
29
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Principios de funcionamiento
30
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Principios de funcionamiento
31
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Funcionamiento de la cach
32
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Funcionamiento de la cach
33
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
34
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
CACHE de
correspondencia
directa
Acceso a
instrucciones
Reemplaza LINEA
en caso de fallo
Ejemplo de
4Kx128bits
35
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
CACHE asociativa
por vas
Acceso a datos
Reemplazo
(aleatorio, LRU)
alguna de las 4
LINEAS si hay fallo
Ejemplo de 4 vas y
32bits de dato
36
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
38
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
40
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Average Memory Access Time = (Hit rate * Hit time) + (Miss rate * Miss time)
41
Introduccin a los DSPs, conceptos bsicos
Jerarqua de memoria
Tamao de la cach
Nmero de vas
43
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
En lenguaje C:
y[n]=0;
For (n=0; n<N;n++)
{
For (k = 0;k<N;k++) Multiplicar y acumular (MAC)
//inner loop
y[n] = y[n] + h[k]*x[n-k];}
45
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
MAC usando un Procesador de propsito general
47
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
48
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
ALTERNATIVAS
Inconvenientes
Alto costo de desarrollo
Lentos ciclos de desarrollo
Poca flexibilidad una vez implementados
49
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
ALTERNATIVAS
Ventajas
Mayor flexibilidad que un ASIC
Alta Performance en algunas aplicaciones
Reusabillidad de Hardware para diferentes aplicaciones
Inconvenientes
Largo ciclo de desarrollo
Caro comparado con un DSP
Mayor consumo de potencia comparado con un DSP
50
Introduccin a los DSPs, conceptos bsicos
Dispositivos DSPs
VENTAJAS DE LOS DSPs
51
Introduccin a los DSPs, conceptos bsicos
Parmetros de seleccin de DSPs
53
Introduccin a los DSPs, conceptos bsicos