Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pregunta # 1 (8 puntos)
Considere una memoria cache con mapeo directo con 128 bloques. El tamao de cada
bloque es de 32 bytes.
a. Encuentre el nmero de bits para tag, bits para indice, y bits de osffset in una
direccin de 32-bit.
Offset bits = 5
Index bits = 7
Tag bits = 32 12 = 20 bits
b. Encuentre el nmero de bits requerido para almacenar todos los bits de validacin y
de tags de la memoria cache.
Total number of tag and valid bits = 128 * (20 + 1) = 2688 bits
c. Dada la siguiente secuencia de referencia a direcciones en decimal:
20000, 20004, 20008, 20016, 24108, 24112, 24116, 24120
Iniciando con una cache vaca, muestre el indice, tag y offset para cada referencia e
indique si hubo un hit o un miss. (A continuacin se proporciona una tabla para que
la vaya llenando con la informacin adecuada.
20000 / 32 = 625 bloques
625 mod 128 = 113 (# del bloque o index)
24108 / 32 = 753.3750
753 mod 128 = 113
0.3750 * 32 = 12
Index (7)
bits)
0x71 = 113
Tag
Hit or Miss
20004 = 0x4E24
0x04 = 4
0x71 = 113
Hit
20008 = 0x4E28
0x08 = 8
0x71 = 113
Hit
20016 = 0x4E30
0x10 = 16
0x71 = 113
Hit
24108 = 0x5E2C
0x0C = 12
0x71 = 113
24112 = 0x5E30
0x10 = 16
0x71 = 113
Hit
24116 = 0x5E34
0x14 = 20
0x71 = 113
Hit
24120 = 0x5E38
0x18 = 24
0x71 = 113
Hit
Decimal
256
512
1024
2048
4096
8192
Index = 10 bits
Offset = 2 bits
Tag = 32 10 2 = 20 bits
b. Cache 2: total size =32KB, Block size = 1 word (4 Bytes), directly-mapped;
32KB = 32*1024 bytes = 8*1024 words = 8192 blocks
Bits
8
9
10
11
12
13
Index = 13 bits
Offset = 2 bits
Tag = 32 13 2 = 17 bits
Decimal
256
512
1024
2048
4096
8192
c. Cache 3: total size =32KB, Block size = 4 words (16 Bytes), directly-mapped;
32KB = 32*1024 bytes = 8*1024 words = 2048 blocks
Bits
8
9
10
11
12
13
Decimal
256
512
1024
2048
4096
8192
Index = 11 bits
Offset = 4 bits
Tag = 32 11 4 = 17 bits
d. Cache 4: total size =32KB, Block size = 4 words (16 Bytes), 4-way associative;
32KB = 32*1024 bytes = 2*1024 blocks = 512 sets (4 blocks each set)
Bits
8
9
10
11
12
13
Decimal
256
512
1024
2048
4096
8192
Index = 0
Offset = 4 bits
Tag = 32 4 = 28 bits
Decimal
256
512
1024
2048
4096
8192
Pregunta # 4 (6 puntos)
Un procesador trabaja a 2 GHz y tiene un CPI de 1.2 sin incluir los ciclos de stall
debido a bsquedas no acertadas en cache (misses). Las instrucciones de load and
store cuentan por el 30% de todas las instrucciones.
El procesador tiene un I-cache y un D-cache. El tiempo cuando se acierta (hit time) es de
1 ciclo reloj. La I-cache tiene un 2% de miss rate. La D-cache tiene un 5% de miss
rate en las instrucciones de load y store.
La penalidad por un miss es de 50 ns, que es el tiempo de acceso y transferencia de un
bloque de cache entre la memoria princiapal y el procesador.
.
a. Cul es el tiempo de acceso promedio para el acceso a una instruccin en ciclos de
reloj?
Stall cycles per instruction = 1 * 0.02 * 100 + 0.3 * 0.05 * 100 = 3.5 cycles
Overall CPI = 1.2 + 3.5 = 4.7 cycles per instruction
d. Usted est considerando reemplazar el CPU de 2 GHz por uno idntico pero que
trabaja a 4 GHz. Cun ms rpido es el nuevo procesador. Asuma que el tiempo de
acertar (hit time) en la I-cache y la D-cache es 1 ciclo de reloj en el nuevo procesador,
y que el tiempo de acceso y de transferencia de un bloque de cache entre la memoria
y el procesador es todava de 50 ns.
Problema # 5 (9 puntos)
Para el datapath de MIPS mostrado a continuacin, algunas lneas han sido marcada con
X. Para cada una de ellas:
1
2
3
Descripcin
Cdigo Ejemplo
Instruccin
Cdigo Ejemplo
Registros/Direccin
Instruccin
sw
$s1, 0($s2)
add
add
addi
addi
beq
$s1, $zero, 10
$s2, $zero, 20
$s1, $s2, exit
a.
C1
C2
C3
C4
IF
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
IF
ID
EX
MEM
Dependencias y hazards:
C5
IF
C6
C7
C8
C9
C10
C11
WB
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
C12
C13
b.
Instruc.
C1
C2
IF
lw $2, 100($6)
lw $3, 200($7)
add $4, $2, $3
C
3
C4
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
no
p
nop
IF
C5
C6
C7
C8
C9
C10
C11
C12
C13
ID
EX
MEM
WB
IF
ID
EX
MEM
WB
no
p
nop
IF
ID
EX
ME
M
WB
nop
nop
IF
ID
EX
ME
M
WB
nop
nop
IF
ID
lw $2, 100($6)
lw $3, 200($7)
nop
nop
add $4, $2, $3
add $6, $3, $5
nop
nop
sub $8, $4, $6
nop
nop
lw $7, 300($8)
nop
nop
beq $7, $8, Loop
c.
Reordene el cdigo de tal forma que obtenga el peor desempeo posible. En otras
palabras, reordene el cdigo de tal forma que la ejecucin de esta secuencia tome
la mayor cantidad de ciclos reloj y se siga obteniendo el mismo resultado. (2
puntos)
MEM
WB
Problema # 7 (1 punto)
Cul de las siguientes proposiciones es verdadera?
a.
b.
c.