EC Pentium4 Cache

PENTIUM 4 SISTEMA DE MEMORIA
Alberto Marco Bahn Alberto Jos Benayas Alamos
ndice

Microprocesadores Pentium 4 Jerarqua de memoria

Memoria Cache L1 Memoria Cache L2 Trace Cache
Optimizaciones del sistema de memoria Conclusiones
Versiones Pentium 4
La jerarqua de memoria
Distribucin niveles de cache

Cache de datos Trace Cache (antigua IC) Resto de niveles unificados: comparten datos e instrucciones
Cache de datos Nivel 1

Tamao reducido Complementada con una cache de segundo nivel mucho mayor y con un gran ancho de banda.
Cache no bloqueante: sigue aceptando peticiones despus de un fallo

Cache de datos de muy baja latencia

2 ciclos en las lecturas de enteros 6 ciclos para la lectura de un dato de punto flotante. TLB de 64 entradas En paralelo a la cache
Cache de datos y Memoria Virtual

Cache de datos Nivel 2

Almacena tanto instrucciones como datos. El tamao de lnea es de 128 bytes divida en dos sectores que pueden accederse independientemente Un fallo en la cache implica la lectura de 128 bytes de memoria principal, para escribir ambos sectores El ancho de banda es de 256 bits para encarar las fuertes necesidades de las aplicaciones multimedia La cache est segmentada admitiendo una nueva operacin cada dos ciclos de reloj Fallo en L2 , se inicia peticin a la MP (bus del sistema) Ancho de banda de 3.2 Gbytes/s,
64 bits del bus se transfieren a una frecuencia efectiva de 400 MHz
Polticas de escritura
Strong Uncacheable

Lecturas y escrituras se ejecuta en orden del programa No se hace ningn acceso a memoria ni TLB til para los dispositivos de I/O a memoria Mismas caractersticas que Strong Uncacheable Puede ser eliminado programando el MTRRs del procesador La escritura se puede retrasar y combinarla en el buffer de escritura para reducir acesos a memoria Si el buffer est lleno se puede retrasar la escritura Permite lecturas especulativas Todas las operaciones de escritura se realizan en MC y MP Si hay acierto de lectura se lee y escribe en MC Si hay fallo se actualiza la MP
Uncacheable

Write Combining

Write-through
Write-back

Write protected
las escrituras se propagan en el bus, ocupando las lneas de cache
Trace Cache

El concepto de Trace Cache fue presentado en 1996. Capturar el comportamiento dinmico de las secuencias de instrucciones Almacenando trazas de instrucciones en lugar de bloques contiguos La Trace Cache se usa en paralelo a la cache de instrucciones. Si la direccin accedida est en la Trace Cache, y las predicciones realizadas sobre esa direccin coinciden con las indicadas en la entrada correspondiente de la Trace Cache, su traza ser la utilizada, olvidndonos del acceso a la cache de instrucciones Si se produce un fallo en el acceso, se proceder a la bsqueda y decodificacin de las instrucciones en la cache de segundo nivel
Trace Cache
La Trace Cache dispone de capacidad suficiente para almacenar 12K micro-operaciones Organizadas en 8 conjuntos, con 6 micro-operaciones en cada lnea.

slo 3 podrn ser suministradas en cada ciclo a la lgica de ejecucin del procesador
Es el medio de evitar la decodificacin reiterada de instrucciones, ya que almacena nicamente micro operaciones.
En caso de fallo en la prediccin de un salto, o de la reejecucin de cierta parte del cdigo, las instrucciones envueltas en la ejecucin no deben ser decodificadas nuevamente, pues ya se encuentran en la Trace Cache (y adems, en el supuesto orden de ejecucin) Incluye su propio predictor de saltos, su objetivo es predecir el comportamiento de las instrucciones de salto presentes en la Trace Cache en un momento concreto Dispone de 512 entradas y de una pila de direcciones de retorno (para las llamadas a funciones y procedimientos) de 16 entradas
10
Optimizaciones del sistema de memoria (aspectos Hardware)

Prefetching de datos Reordenacin de lecturas (Store forwarding) respecto a otras operaciones de memoria Uso del dato a escribir por un store por los loads dependientes de l (Store-to-Load forwarding) Ejecucin especulativa de lecturas Combinacin de escrituras
11
Parmetros cache Pentium

Asociatividad (vas) Longitud de lnea (bytes) Latencia de acceso, Enteros/FP (ciclos) Poltica de escritura
Nivel
Capacidad
Primero (Datos)
8 KB
64
2/6
Write Through
Trace Cache
12 K uops
N/A
N/A
N/A
Segundo Nivel
512 KB
128
7/7
Write Back
12
Caractersticas
P4 423 pines
P4 con 256 KB de cach
P4 con 512 KB de cach
P4 con FSB de 800 MHz
P4 Extreme Edition
Microarquitectura
NetBurst
NetBurs t
NetBurst
NetBurst
NetBurst
NetBurst
Frecuencias (GHz)
1,30 - 2
1,50 - 2
1,60 - 3,06
2,40 - 3,40
3,20 y 3,40
2,40 - 3,40
Tamao L2 Tamao L3
256K No se aplica
256K No se aplica
512K No se aplica
512K No se aplica
512K 2 MB
1MB No se aplica
Velocidad del bus de sistema (Mhz)
400
400
400 , 533
800
800
800
Algunas medidas
14
Conclusin

Se separan las instrucciones de los datos Hay dos niveles de cache, L1 de 8Kb, y L2 mucho ms grande 512Kb Trace cache est basada en micro operaciones, lo cual elimina trabajo de decodificacin innecesario. Adems se ordenan de la forma ms eficiente
15
Bibliografa
http://www.intel.com/technology/itj/2004/volume08issue
01/art01_microarchitecture/p03_netburst.htm http://sobrepc.com/hardware/pentium4/p4-1.html
http://support.intel.com/support/sp/processors/pentium4/ sb/cs-007991.htm http://www.die.upm.es/cursos/Hardware.pdf http://perso.wanadoo.es/koudelin/pentium4.htm http://arstechnica.com/articles/paedia/cpu/pentium2.ars

16

EC Pentium4 Cache

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

EC Pentium4 Cache

Cargado por

Copyright:

Formatos disponibles

PENTIUM 4 SISTEMA DE MEMORIA

Alberto Marco Bahn Alberto Jos Benayas Alamos

Microprocesadores Pentium 4 Jerarqua de memoria

Optimizaciones del sistema de memoria Conclusiones

Distribucin niveles de cache

Cache de datos Nivel 1

Cache no bloqueante: sigue aceptando peticiones despus de un fallo

Cache de datos y Memoria Virtual

Cache de datos Nivel 2

64 bits del bus se transfieren a una frecuencia efectiva de 400 MHz

las escrituras se propagan en el bus, ocupando las lneas de cache

Optimizaciones del sistema de memoria (aspectos Hardware)

Parmetros cache Pentium

P4 con 256 KB de cach

P4 con 512 KB de cach

P4 con FSB de 800 MHz

Velocidad del bus de sistema (Mhz)

http://support.intel.com/support/sp/processors/pentium4/ sb/cs-007991.htm http://www.die.upm.es/cursos/Hardware.pdf http://perso.wanadoo.es/koudelin/pentium4.htm http://arstechnica.com/articles/paedia/cpu/pentium2.ars

También podría gustarte