Está en la página 1de 16

Ejercicio 1

Programa Comp. A Comp. B Comp. C

P1 1 10 20
P2 1000 100 20

a) Seis posibles comparaciones

Comp. A es 10 veces más rápido que el comp. B ejecutando el programa P1


Comp. A es 20 veces más rápido que el comp. C ejecutando el programa P1
Comp. B es 2 veces más rápido que el comp. C ejecutando el programa P1

Comp. B es 10 veces más rápido que el comp. A ejecutando el programa P2


Comp. C es 50 veces más rápido que el comp. A ejecutando el programa P2
Comp. C es 5 veces más rápido que el comp. B ejecutando el programa P2

Ranking ejecutando P1: A, B, C Confuso, no es posible determinar


Ranking ejecutando P2: C, B, A determine cuál es el mejor computador
Programa A B C

P1 1 10 20
P2 1000 100 20

b) Media aritmética (M.A)

• Normalizado a A:
Programa A B C A B C

1
N Ranking:
P1 1 10 20 M.A = Σx
N j =1 j
1 5.05 10.01 A,B,C
P2 1 0.1 0.02

• Normalizado a C:

Programa A B C A B C

1
N Ranking:
P1 0.05 0.5 1 M.A =
N
Σ xj 25.025 2.75 1 C,B,A
P2 50 5 1 j =1
Programa A B C

P1 1 10 20
P2 1000 100 20

c) Media geométrica (M.G)

• Normalizado a A:
Programa A B C A B C C es 1/0.63
𝑛𝑛
𝑛𝑛
= 1.58 veces
� 𝑥𝑥𝑗𝑗 más rápido
P1 1 10 20 M.G = 1 1 0.63
P2 1 0.1 0.02
𝑗𝑗=1
que A y B

• Normalizado a C:
Programa A B C A B C C es 1.58
𝑛𝑛
𝑛𝑛 veces más
� 𝑥𝑥𝑗𝑗
P1 0.05 0.5 1 M.G = 1.58 1 .58 1 rápido que
𝑗𝑗=1
P2 50 5 1 AyB
Ejercicio 2
ENT (sin HW PF) Pent: rutinas con instrucciones de enteros
f = 1600 Mhz P realiza 200.000 ops FP
HWPF (con HW PF) Phwpf: instrucciones en PF

Programa Procesador Tiempo ejecución CPI promedio


Phwfp HWFP 0,01 segundos 10
Pent Ent 0,12 segundos 6

a) MIPS de las ejecuciones


𝑁𝑁𝑁 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑁𝑁𝑁 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 × 10−6 𝑓𝑓(ℎ𝑧𝑧) × 10−6 𝑓𝑓(𝑀𝑀𝑀𝑀𝑀)
Tiempo de ciclo: t = 1/ f 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = −6
× 10 = = =
𝑇𝑇𝐶𝐶𝐶𝐶𝐶𝐶 (𝑠𝑠) 𝑁𝑁𝑁 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 × 𝐶𝐶𝐶𝐶𝐶𝐶 × 𝑡𝑡(𝑠𝑠) 𝐶𝐶𝐶𝐶𝐶𝐶 𝐶𝐶𝐶𝐶𝐶𝐶

Sustituyendo los datos del problema:


1600
Phwpf: 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = = 160
10

1600
Pent: 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = = 266,7
6
Ejercicio 2
ENT (sin HW PF) Pent: rutinas con instrucciones de enteros
f = 1600 MHz P realiza 200,000 ops FP
HWPF (con HW PF) Phwpf: instrucciones en PF

Programa Procesador Tiempo ejecución CPI promedio


Phwfp HWFP 0,01 segundos 10
Pent Ent 0,12 segundos 6

b) Número total de instrucciones ejecutadas


Phwpf: Nº instr = MIPS x 106 x TCPU (s) = 160 x 106 x 0,01s = 1,6 x 106 instrucciones
Pent: Nº instr = = 266,7 x 106 x 0,12s ≈ 32 x 106 instrucciones

c) Número medio de instrucciones enteras que sustituye cada operación en punto flotante en Pent
Instrucciones enteras en Phwpf: 1.600.000 – 200.000 = 1.400.000
Operaciones en rutinas SW en Pent: 32.000.000 – 1.400.000 = 30.600.000
Cada operación en PF es sustituida, en promedio, por 30.600.000 / 200.000 = 153 instrucciones enteras

d) Los MFLOPS obtenidos en la ejecución de Phwpf:


𝑁𝑁𝑁 𝑜𝑜𝑜𝑜 𝑒𝑒𝑒𝑒 𝑃𝑃𝑃𝑃 −6
200.000
Se ejecutan 200,000 operaciones en PF en 0,01 s 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = × 10 = × 10−6 = 20
𝑇𝑇𝐶𝐶𝐶𝐶𝐶𝐶 (𝑠𝑠) 0,01(𝑠𝑠)
Ejercicio 3

Computador 1 100 MIPS


Computador 2 150 MIPS

a) Misma ISA, distinta frecuencia


En 1 s el computador 2 ejecuta 1,5 veces más instrucciones (del mismo tipo) que el computador 1  es mejor el 2

b) Misma ISA, misma frecuencia


Igual que en el caso a)

c) Distinta ISA, misma frecuencia


Datos insuficientes. Al tratarse de distintos repertorios de instrucciones no podemos concluir qué computador
ejecuta más trabajo por unidad de tiempo.
Ejercicio 4

CPIent = 1; CPIFP = 5 ¿Es interesante (Rendimiento/coste) rediseñar la parte de PF para


20% de operaciones en PF ser 5 veces más rápida, a costa de duplicar el coste de la CPU?

Tantes F Tent = Nent x CPIent x t Tent = 0.8N x 1 x t Tent = 0.8N x t


Tent TFP TFP = NFP x CPIFP x t TFP = 0.2N x 5 x t TFP = N x t
F?
= ÷5 𝑁𝑁 × 𝑡𝑡 1
𝑇𝑇𝐹𝐹𝐹𝐹 𝑁𝑁 × 𝑡𝑡
Tdespues F= = = =
𝑇𝑇𝐹𝐹𝐹𝐹 + 𝑇𝑇𝑒𝑒𝑒𝑒𝑒𝑒 𝑁𝑁 × 𝑡𝑡 + 0.8𝑁𝑁 × 𝑡𝑡 𝑁𝑁 × 𝑡𝑡 (1 + 0.8) 1.8
Tent TFP/5

1 1 No es
Speedup = = = 1.8 Δ Coste (2) > Speedup (1.8) interesante
𝐹𝐹 1
1 − 𝐹𝐹 + 𝑥𝑥 1 1.8 el rediseño
1 − +
1.8 5

Tb se puede resolver gráficamente (sin necesidad de calcular F):


𝑇𝑇 𝑇𝑇 + TFP 0.8𝑁𝑁 × 𝑡𝑡 + 𝑁𝑁 × 𝑡𝑡 1.8𝑁𝑁 × 𝑡𝑡 No es
Speedup = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 = 𝑒𝑒𝑒𝑒𝑒𝑒 = = = 1.8 Δ Coste (2) > Speedup (1.8) interesante
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑇𝑇𝑒𝑒𝑛𝑛𝑛𝑛 + TFP/5 0.8𝑁𝑁 × 𝑡𝑡 + (𝑁𝑁 × 𝑡𝑡) /5 𝑁𝑁 × 𝑡𝑡
el rediseño
Ejercicio 5

El HW de PF mejora el procesamiento de números en PF en un factor 5 ¿% del tiempo de ejecución que el programa


T (con HW de PF) = 60 s; está realizando operaciones en punto flotante
T (sin HW de PF) = 150 s; como secuencias de operaciones enteras?

Tantes (150s) F
F?
Tent TFP

= ÷5
Tdespues (60s)
Tent TFP/5

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 150 1 1
Speedup = = = 2.5 = = F = 0.75 75%
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 60 1 − 𝐹𝐹 + 𝐹𝐹 /𝑥𝑥 1 − 𝐹𝐹 + 𝐹𝐹 /5
Ejercicio 7
10% E/S
A1 (20%) 20% FP Sustituir un elemento del subsistema E/S para mejorar en un 150% sus
1200 € 70% ENT prestaciones, así como cambiar el hw de punto flotante por otro el doble
A2 (80%) 40% E/S de rápido. ¿Cuánto pagarías por el conjunto de estas dos mejoras?
60% ENT

Más de una 𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 1


Speedup = 𝑇𝑇 =
mejora 𝐹𝐹 𝐹𝐹 𝐹𝐹
𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 1 − 𝐹𝐹1 + 𝐹𝐹2 + ⋯ + 𝐹𝐹𝑛𝑛 + 𝑥𝑥1 + 𝑥𝑥 2 + ⋯ . . + 𝑥𝑥 𝑛𝑛
1 2 𝑛𝑛

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 1
En nuestro caso Speedup = =
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 1 − 𝐹𝐹 + 𝐹𝐹 + 𝐹𝐹1 + 𝐹𝐹2
1 2 𝑥𝑥1 𝑥𝑥2

F1 (mejora en E/S): 0.2 x 0.1 + 0.8 x 0.4 = 0.34 F2 (mejora en FP): 0.2 x 0.2 = 0.04
X1 (mejora en E/S): 150% X1 = 2.5 X2 (mejora en FP) = 2

1 Costedespues =
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
Speedup = = 1.29 Speedup = Δ Coste = 1.29 = 1.29 x 1200 =
0.04 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
1 − 0.34 + 0.04 + 0.34 + 1548 €
2.5 2

Se pagarían 1548 – 1200 = 348 € por las dos mejoras


Ejercicio 8

X1 = 5 F1 = 20% ¿F3 para alcanzar un speedup de 5?


X2 = 7 F2 = 25%
X3 = 10

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 1
Speedup = =
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝐹𝐹 𝐹𝐹 𝐹𝐹
1 − 𝐹𝐹1 + 𝐹𝐹2 + 𝐹𝐹3 + 𝑥𝑥 1 + 𝑥𝑥 2 + 𝑥𝑥 3
1 2 3

1
5= F3 = 0,473 F3 = 47,3 %
0,2 0,25 𝐹𝐹3
1 − 0,2 + 0,25 + 𝐹𝐹3 + + 7 + 10
5
Ejercicio 9
Nueva tarjeta controladora que ahorrará la mitad de accesos a
20% accediendo a la RAM de video la memoria de vídeo a costa de duplicar los accesos a los
2% en ops de E/S sobre los puertos de la controladora puertos. Si el PC costó 1000, ¿cuánto dinero podría gastarse
como máximo en sustituir la controladora?

- Mejora en el tiempo invertido en los accesos a memoria (el tiempo se reduce a la mitad): x1 = 2

- Mejora en el tiempo invertido en los accesos a los puertos (el tiempo se duplica): x2 = 1/2 ;
(en realidad lo que hay es un empeoramiento)

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 1 1
Speedup = = = = 1,087
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝐹𝐹 𝐹𝐹 0,2 0,02
1 − 𝐹𝐹1 + 𝐹𝐹2 + 𝑥𝑥 1 + 𝑥𝑥 2 1 − 0,2 + 0,02 +
1 2 2 + 1/2

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 Se pagarían 1087 – 1000 =


Speedup = Δ Coste = 1,087 = Costedespues = 1,087 x 1000 = 1087 €
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 87 € por la nueva tarjeta
Problema 10
a)
Con un computador:

Configuración Coste Speedup Rel Speedup/Coste Aprovechable?


Base (PAM1) 2000 1 1/2000 = 5x10-4 No (Speedup = 1)
PAM1+DSPX 2400 1,33 * 1,33/2400 = 5,4x10-4 No (Speedup = 1.33)
PAM2+DSPX 2700 2 ** 2/2700 = 7,4x10-4 Sí (Speedup = 2)

∗ El 50% de la aplicación duplica la veloclidad (de 100 a 200 MFLOPS). Luego: F= 0,5 y x=2.
1
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 0,5 = 1,33
0,5+
2

** Debido al solapamiento de “Generar modelo” y “Analizar resultados” con la actuación del


DSPX el tiempo se reduce a la mitad: T mejora = T sin mejora / 2
𝑇𝑇sin 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
Por tanto, 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = =2
𝑇𝑇𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
Problema 10 (cont)

Con dos computadores:

Configuración Coste Speedup Rel Speedup/Coste Aprovechable?


2 Comp+PAM1+ 3200 2 2/3200 = 6,3x10-4 Sí (Speedup) = 2
Lic adicional
2 Comp+PAM1+ 4000 * 2,66 ** 2,66/4000 = 6,7x10-4 No (gasto > 1500)
2 x DSPX +
Lic adicional
2 Comp+PAM2+ 4300 4 *** 4/4300 = 9x10-4 No (gasto > 1500)
2 x DSPX +
Lic adicional

∗ 3200 + 2 DSPX
** 2 x 1.33 (tenemos dos computadores)
*** 2 x 2 (tenemos dos computadores)

Con tres computadores:


Fuera de presupuesto

Conclusión: la mejor opción es 1 computador con PAM2+DSPX, dado que ofrece la mejor
relación speedup/coste dentro del presupuesto.
Problema 10 (cont)
b)

Gen Modelo consume el 30% del tiempo. Luego el tiempo total = 2,5 / 0,3 = 8,33 s

Módulo Tiempo (s) MFLOPS Operaciones


Gen Modelo 2,5 80 2,5x80x106 = 200x106
(30%)
Sim Comportam 8,33x0,5 = 100 4,17x100x106 = 417x106
(50%) 4,17
Analizar resul 8,33x0,2 = 70 1,67x70x106 = 117x106
(20%) 1,67
TOTAL 734x106 operaciones
Ejercicio 11
(a) Aumentar la frecuencia de reloj en un 15 % a costa de
CPIFP = 4; CPIRC = 20; CPIresto = 1.33
aumentar a 23 los CPI de las instrucciones de raíz cuadrada.
25% de operaciones en PF
(b) Reducir a 2 los CPI de las instrucciones en PF
2% de raíces cuadradas
¿Qué opción es la más acertada?

CPIoriginal = 0,25x4 + 0,02x20 + 0,73x1,33 = 2.37

a)
CPIa = 0,25x4 + 0,02x23 + 0,73x1,33 = 2,43 fa = 1,15xforiginal

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑁𝑁𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 × CPIoriginal × toriginal 𝐶𝐶𝐶𝐶𝐶𝐶𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 × toriginal 2,37 × 1/foriginal


Speedupa = = = = = 1,12
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑁𝑁𝑎𝑎 × 𝐶𝐶𝐶𝐶𝐶𝐶𝑎𝑎 × 𝑡𝑡𝑎𝑎 𝐶𝐶𝐶𝐶𝐶𝐶𝑎𝑎 × 𝑡𝑡𝑎𝑎 1
2,43 × ( )
1,15 foriginal
b)
CPIb = 0,25x2 + 0,02x20 + 0,73x1,33 = 1,87 tb = t original

𝑇𝑇𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑁𝑁𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 × CPIoriginal × toriginal 𝐶𝐶𝐶𝐶𝐶𝐶𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 2,37


Speedupb = = = = = 1,26
𝑇𝑇𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑁𝑁𝑏𝑏 × 𝐶𝐶𝐶𝐶𝐶𝐶𝑏𝑏 × 𝑡𝑡𝑏𝑏 𝐶𝐶𝐶𝐶𝐶𝐶𝑏𝑏 1,87

Speedupb > Speedupa La opción b es mejor


Ejercicio 12

El nº total de instrucciones, N, es 1012 . El CPI es 2.


El T de ejecución de las op en PF es el 20% del total
El nº de instrucciones en PF es el 10% del total = 0,1 x 1012
En general: T = N x CPI x t = 1012 x 2 x t

Las instrucciones en PF consumen el 20% del tiempo de ejecución. Luego:


TPF = 0,2 T ; Sustituyendo: TPF = 0,2 (2 x 1012 x t) = 0,4 x 1012 x t

Pero también: TPF = NPF x CPIPF x t = 0,1 x 1012 x CPIPF x t;


Igualando:
0,4 x 1012 x t = 0,1 x 1012 x CPIPF x t; De donde: CPIPF = 4

También podría gustarte