Está en la página 1de 29

Actualización AMD Opteron™ “Barcelona”

Mayo de 2008

A. David Garza Marín


AMD Latin America, LTD.
david.garza@amd.com
Núcleos por cuatro –
Más allá del rendimiento

CONFIDENTIAL
El núcleo adelantado

Nombre de la característica Descripción Beneficio


Independent Dynamic Core Frecuencia independiente Ahorro de energía
por núcleo
Technology
AMD CoolCore™ Technology Control crudo y fino de Ahorro de energía
transistores

Dual Dynamic Power (Anteriorment “plano Ahorro de energía


bifurcado”) Planos
Management™ (DDPM) independientes de voltaje Mayor rendimiento
para los núcleos y el
controlador de memoria

AMD Wide Floating Point Punto flotante de 128 Bits Rendimiento mejorado de
(Ductería completa) punto flotante
Accelerator
AMD Memory Optimizer Acceso a la memoria, uso Mayor rendimiento
de los núcleos
Technology
AMD Balanced Smart Cache Cache L1/L2/L3, balanceo Mayor rendimiento,
entre dedicado y menor hiperpaginación
compartido

Rapid Virtualization Indexing Paginación anidada y TLB Mayor rendimiento en


etiquetados virtualización

3
Procesador AMD Opteron™ Quad-Core

Coadyuva a reducir el CTP (TCO)


Protección de la al simplificar la administración y
inversión permitir más suaves
transiciones de tecnología

Características de AMD Valor para los negocios


Estrategia de núcleo común Para simplificar las transiciones tecnológicas y
reducir los costos de mantenimiento, coadyuva
a conserbar su imagen de software de TI al
permitir menos alteraciones en la actualización

Infraestructura en el mismo Permite sencillas actualizaciones de hardware al


conector (socket) conservar las propiedades térmicas y eléctricas
consistente en diversas generaciones de
procesadores. Coadyuva en la longevidad y en
el rendimiento/vatio, al tiempo que facilita la
planeación de las instalaciones.

AMD ofrece una directriz estable y consistente – con


transiciones bien reguladas – para proteger las inversiones
de nuestros clientes y reducir su costo total de propiedad
Procesador AMD Opteron™ Quad-Core

Coadyuva a reducir los costos


Efiencia mejorada en de energía y enfriamiento de su
la energía infraestructura de TI

Características de AMD Valor en los negocios


Tecnología Enhanced AMD Reduce el consumo de energía del
PowerNow!™ - Tecnología procesador mediante el ajuste del uso de la
Independent Dynamic Core™ energía por cada núcleo

Dual Dynamic Power Reduce el consumo de energía del


Management™ procesador al habilitar más capacidades
granulares de administración de energía

Tecnología AMD CoolCore™ Reduce el consumo de energía al apagar las


partes que no se usen del procesador
Procesador AMD Opteron™ Quad-Core

Coadyuva en la consolidación y
Virtualización la flexibilidad del cómputo con
óptima la mejor arquitectura x86 y
soporte a la plataforma

Características de AMD Valor en los negocios


La mayor eficiencia en cargas de trabajo con uso
Arquitectura Direct Connect
intenso de la memoria como la virtualización,
coadyuva a albergar más máquinas virtuales por
servidor y a mejorar el uso de los recursos.

AMD-V™ con Rapid Virtualization Rendimiento y eficiencia mejorados para muchas


cargas de trabajo virtuales, con lo que se permite
Indexing tener un entorno de mayor rendimiento, fasí como
un entorno de TI más flexible.

AMD Balanced Smart Cache Mejora la eficiencia de los núcleos para obtener un
mejor apoyo para entornos Improves core
efficiency for better support of multi-threaded
virtualization environments.

Ofrece la plataforma de virtualización más eficiente en x86,


lo que permite un soporte a TI altamente flexible y escalable
Procesador AMD Opteron™ Quad-Core

Arquitectura del sistema más


Rendimiento eficiente y características del
sobresaliente núcleo que ofrecen un mejor
apoyo a aplicaciones de
múltiples subprocesos

Características de AMD Valor en los negocios


Coadyuva a mejorar el rendimiento de la memoria
Dual Dynamic Power
y permite reducir el consumo de energía y su
Management™ facturación.

Tecnología AMD Memory Ancho de banda perfeccionado a la memoria,


diseñado para la operación de núcleos cuádruples,
Optimizer mejora el rendimiento de entornos de software de
múltiples subprocesos.
AMD Wide Floating-Point Capacidades duplicadas de punto flotante que
mejoran enormemente el rendimiento en HPC y
Accelerator procesos científicos, que reduce los tiempos de
cálculo.

Las actualizaciones integrales en el rendimiento dan por resultado un


procesador que ofrece un significativamente mejor rendimiento por vatio, con
lo que se mejora el grado de reacción en la TI al tiempo de mantener bajos
los costos
Beneficio arquitectónico de AMD
Comparación multicore
AMD

Core Core Core Core


1 2 3 4
Core Core Core Core
1 2 3 4 Cache Cache Cache Cache
L2 L2 L2 L2

Cache L2 Cache L2 Cache L3


CROSSBAR

Hyper
Memory
Transport
Controller
Interface

FSB HyperTransport
PCI / PCI-e

PCI / PCI-e
Chipset
Memory
Chipset
Controller
Quad-Core Xeon MP “Tigerton”
MCP MCP MCP MCP

SRQ SRQ
Crossbar Crossbar
Mem.Ctrlr HT Mem.Ctrlr HT

8 GB/S

USB PCIe™ SRQ SRQ


I/O Hub
I/O Hub Bridge Crossbar Crossbar
Memory PCI-E Mem.Ctrlr HT Mem.Ctrlr HT
PCI Controller Bridge
Hub
8 GB/S 8 GB/S

PCIe PCIe
Bridge Bridge

8 GB/S
USB
I/O Hub
PCI

AMD64 Technology with


Legacy x86 Architecture
• 20-year old front-side bus architecture Direct Connect Architecture
• CPUs, Memory, I/O all share a bus • Industry-standard AMD64 technology
• 4-cores Per Bus, Just like Potomac • AMD‟s revolutionary Direct Connect Architecture reduces
• Can be a bottleneck to performance bottlenecks inherent in traditional FSB architectures
• HyperTransport™ technology interconnect for high
bandwidth and low latency

9
November
Dual Dynamic Power Management™

– Planos de energía separados para los núcleos y la


memoria, de modo que se obtiene:
Consumo óptimo de energía – Permite que los núcleos
operen con menor consumo de energía, mientras que la
comunicación con la memoria se realiza a toda velocidad
Mayor rendimiento – El controlador de memoria puede
operar a mayor frecuencia para tener un mayor ancho de
banda y rendimiento

Placa con un plano de energía único Con Dual Dynamic Power Management

Energía
Acometida Núcleos de la CPU Núcleos
única de
energía Controlador Controlador
de memoria
Energía de
de memoria
la memoria

10
Mejoras al manejo de energía
with Enhanced AMD PowerNow!™
Dual-core Multi-chip Module Native Quad-core

75% 35%
75% 35%
CORE 0 CORE 1

CORE 0 CORE 1
10% 1%

CORE 2 CORE 3

Los hercios y el Los hercios se


establecen en el p-state Los hercios se ajustan
voltaje se
del núcleo más utilizado independientemente por
encadenan al p-
de cada dado dual core. cada núcleo. El voltaje
State del núcleo
El voltaje se encadena al se establece al p-state
más utilizado.
núcleo más utilizado en del núcleo más utilizado.
el paquete.

La tecnología de núcleo cuádruple nativo permite una mejor


administración de energía en los núcleos
11 Barcelona Pre-Launch Training Overview
Noviembre,
Tecnología AMD Memory Optimizer

Actualizaciones integrales a nuestro controlador de memoria


Canales independientes de memoria (2x Más)1
• 2x "bancos" disponibles de memoria = mayor ancho de banda
“Barcelona”
Mejoras al ancho de banda de la memoria

~150%1 Búferes de memoria más grandes (~2-4x Más)1


• Perfeccionado para las tasas de datos de DDR2
~140%
Explosión de escritura
• Transición reducida de lectura/escritura = Mayor ancho de
banda

100% Paginación perfeccionada de DRAM


• Un algoritmo más inteligente que coadyuva a mejorar el ancho
Dual-Core AMD Opteron™

de banda
Processor with DDR2

Precargador de DRAM
• Predice y recopila inteligentemente los datos necesarios de la
memoria principal; no corrompe la jerarquía de la cache

Precargadores del núcleo


• Datos recopilados directamente a la caché L1; ~5ns de menor
latencia1 y economiza el ancho de banda L2

Mayor ancho de banda para una escalabilidad en QuadCore

12
1. Comparado con procesadores AMD Opteron de segunda generación y con la
misma frecuencia de reloj.
Mejoras a la potencia de la plataforma
Tecnología Enhanced
AMD PowerNow!™ con
Independent Dynamic Diseño nativo QuadCore
Tecnología de
Core Technology
procesamiento Para mejorar el rendimiento por
avanzado Puede reducir vatio sin aumentar el consumo
dinámicamente el de energía máximo
Silicio Sobre Aislante consumo de energía
(SOI) hasta un 75% Tecnología CoolCore™
Rápidas transiciones con Reduce la energía al apagar
bajas pérdidas de energía secciones sin usar de la CPU

Tecnología de Vínculos de tecnología


virtualización HyperTransportTM
Diseñada para reducir la Ofrece transferencias de datos
sobrecarga de la CPU en en el sistema, con uso eficiente
entornos virtualizados de la energía
•Procesador a procesador
•Procesador a la memoria
Controlador de memoria •Procesador a la E/S
integrado

Controlador de memoria Administración de energía


incluido en el cálculo de dinámica dual
energía
Coadyuva a mejorar el
Se apoya de la memoria rendimiento y reducir el
RDDR2 de bajo consumo consumo de energía de la
plataforma

13
Beneficio del núcleo cuádruple nativo:
Mejor intercambio de datos
Situación: El núcleo 1 necesita datos de la caché del núcleo 3, ¿cómo los obtiene?

Tecnología QuadCore Nativa Tecnología Dado Cuádruple


Núcleo 1 Núcleo 2 Núcleo 3 Núcleo 4
L3 100011

Núcleo 1 Núcleo 2 Núcleo 3 Núcleo 4 L2 L2


100011
Bus frontal Bus frontal
L2 L2 L2 L2
System Request Queue
Crossbar
Hyper Transport™ Controlador de memoria Controlador de memoria

Northbridge

1. El Núcleo 1 verifica la caché del 1. El Núcleo 1 envía una petición al controlador


Núcleo 3, y copia los datos de memoria, que verifica la caché del Núcleo 3
2. El Núcleo 3 envía los datos al controlador de
directamente de él cache memoria, y éste al Núcleo 1

Sucede a la frecuencia del procesador Sucede a la frecuencia del bus frontal

Resultado: Puede mejorar el Resultado: Puede reducir el


rendimiento multinúcleo rendimiento multinúcleo

14
Noviembre, 2007
Caché inteligente balanceado de AMD
Balanced
AMD Balanced Smart Cache
Mejor soporte a entornos multitarea

Core 1 Core 2 Core 3 Core 4 Core 1 Core 2 Core 3 Core 4

L1 L1 L1 L1
L1 L1 L1 L1
x x
L2 L2 L2 L2
L2 L2

L3
Bus frontal
Controlador de memoria integrado Controlador de memoria externo

• El núcleo 1 ejecuta una gran carga de • El núcleo 1 ejecuta una gran carga de trabajo
trabajo (>4MB), de modo que necesita toda (>4MB), de modo que necesita de toda la
la caché L3 y acceder a la memoria cache L2 y acceder a la memoria principal
principal • El núcleo 2 no puede hacer nada (a esto se le
• Los núcleos 2, 3 y 4 también podrán llama “thrashing”)
ejecutar cargas menores • Lo mismo puede suceder entre los núcleos 3
y 4 (más trashing
15 Barcelona Pre-Launch Training Overview
Noviembre, 2007
Medidas reales de consumo de energía
en la memoria
Fuertes penalizaciones de energía y calor
en capacidades de memoria con el uso de FBDIMM

DDR2 vs. FBDIMM Average Power Consumption for 8x DIMMs


(1GB DDR2 vs. 1GB FBDIMM)

120w
Con 8 DIMMs;
FBDIMM consume 100w
~83 vatios en
modo INACTIVO
Sólo ~14 vatios se 80w
consumen en
DDR2 60w
40w
8x FBDIMMs
consumen más de 20w
100w en carga
total vs. sólo 0w
~37w en DDR2 SPECcpu2000 SPECcpu2000
IDLE Power SPECjbb2005
INT FP
8x DDR2 (AMD) 14.32 33.68 29.24 36.94
8x FBDIMM (Intel) 83.34 95.49 90.21 101.2
1GB DDR2-667 DIMM: 1GB 667 FB-DIMM:
Brand: Micron Brand: ATP
Model: MT18HTF12872Y-667D6 Model: AP28K72S8BHE6S

16
Comparación de energía en plataforma QuadCore
Consumo proyectado de energía en una plataforma (8xDIMMs)

8xDIMMs
4xDIMMs
83.2W
17.6W 68W
15W

32.4W
4xDIMMs

12.4W 68W 17.6W

50W 50W

Quad-Core Intel Xeon Serie 5300 Procesador AMD Opteron™ “Barcelona” QuadCore
• 100w por los procesadores (50w TDP) • 136w en los procesadores (68w POTENCIA MAX)
• 44w del chipset • 15w del chipset
$por/año
(un servidor)
$320 228W $por/año
(un servidor) $261 186W
778 BTU/Hr 635 BTU/Hr

$por/año
$159,782
23% $por/año $29,293
(500 servs.) $130,489 DE AHORRO
Más (500 servs.)
Los estimados de energía incluyen la alimentación de energía y el enfriamiento a un 60%, Costo de la energía: $0.10/KW-hr, basado
en las actuales especificaciones disponibles públicamente de procesador y chipset y estimados de AMD. Este ejemplo se presenta sólo
con propósitos informativos, los resultados reales pueden variar. Hay otros factores que afectan el consumo y costo reales.
17
Impacto proyectado de infraestructura del Quad Core
A escala de estante (Rack)
Energía determinada de 7Kw 7Kw Power Budget
• Los procesadores AMD Opteron de segunda
generación tienen una ruta planeada de 10%
14%
desper.
actualización a cuádruple núcleo con el desper.
mismo consumo de energía. Clovertown
eleva los requerimientos térmicos y de
energía en cada banda de energía.

• Los consumidores de Intel podrían ser Difícil


Fácil forzados a elegir entre mayor costo de transición a
transición a energía y enfriamiento o desperdiciar Quad Core
Quad Core espacio del estante

Banda TDP Intel TDP AMD


ener.
Dual %+ Quad Dual %+ Quad
High 80W 50% 120W 120W 0% 120W
Std. 65W 23% 80W 95W 0% 95W Dual-core Quad-core
Dual-core Quad-core
19 servs. 2U 18 servs. 2U
20 servs. 2U 20 servs. 2U Low 40W 25% 50W 68W 0% 68W 76 núcleos en 144 núcleos
80 núcleos en 160 núcleos total en total
total en total
Procesadores AMD Opteron™ Intel Xeon
Diseñado para aprovechar al máximo la Puede desperdiciar espacio en el
densidad de servidores y minimizar las los centro de datos, y aumentar los
problemas en las transiciones problemas en las transiciones
Wattage based on 2P systems, 8 DIMMs, TDP wattage for „Dempsey‟, „Woodcrest‟ & „Clovertown‟ is estimated based on current publicly available processor and chipset
values, AMD estimates, and an incremental 100watts for fans, storage, and power supply. (see, eg: http://techreport.com/etc/2006q2/woodcrest/index.x?pg=2 and is
subject to change. The examples contained herein are intended for informational purposes only. Other factors will affect real-world power consumption.

18
Impacto de infraestructura de Quad Core
Escala de Centro de datos
Presupuesto de energía Mayor calor y
del centro de datos Procesadores
consumo de
Fácil transición a energía que puede
AMD Opteron™
7 Megavatios obligar a costosas
de segunda
10%
14% de
actualizaciones
generación de
Dual Core Quad Core las espaciocon
instalaciones:
una actualización
100 Racks 100 Racks desperdiciado
planeada a quad
8000 núcleos 16,000 núcleos con Xeon XeonDual
$ Ampliación a las
con
coreinstalaciones
en el mismo
Quad
$plano
Costo Core Core y
térmico
de electricidad
$ Distribución de
de consumo
energía
de
Dual-core energía
$ Equipamiento HVAC

90 Racks
Poder
6840 núcleos limitado

Difícil
transición a
Quad-core

Quad-core
85 Racks PODER
LIMITADO
12,240 núcleos

Wattage based on 2P systems, 8 DIMMs, TDP wattage for „Dempsey‟, „Woodcrest‟ & „Clovertown‟ is estimated based on current publicly available processor and chipset
values, AMD estimates, and an incremental 100watts for fans, storage, and power supply. (see, eg: http://techreport.com/etc/2006q2/woodcrest/index.x?pg=2 and is
subject to change. The examples contained herein are intended for informational purposes only. Other factors will affect real-world power consumption.

19
Liderazgo de AMD Virtualization™

Alto rendimiento
La arquitectura Direct Connect
Rapid Virtualization Indexing
Tagged TLB

¡Albergue más máquinas


virtuales por cada sistema!

Muy seguro
DEV (Device Exclusion Vector)

Soportado en software
AMD-V™ Extended Migration
Soporte a SOs sin modificación
Robusto ecosistema de Software

2121 Barcelona Pre-Launch Training Overview


Noviembre, 2007
Métodos de administración de la memoria
Traducción de la memoria virtual a la física

Con Virtualization
Sin VM1 VM2
Virtualización Memoria virtual 1 Memoria virtual 2

Memoria virtual

Memoria física Memoria física

Tablas de Paginación Anidada


páginas (Índice rápido de
virtualización)
Sombra

La traducción Hardware Software Hardware


se hace en (la propia CPU) (en Hypervisor) (la propia CPU)

La traducción se Hardware Memoria virtual Hardware


almacena en (en TLB) (DRAM o disco) (en TLB huésped)

La Paginación Anidada traduce la memoria en hardware, como si no


estuviera virtualizada. Coadyuva a mejorar el rendimiento.
22
Índice rápido de virtualización
Mejor rendimiento para aplicaciones virtualizadas

Rapid Virtualization Indexing (Nested Paging)


Las búsquedas de la memoria se realizan
en el hardware, lo que es más ágil que
mediante el software Application Application
Guest OS Guest OS

Requiere menor intervención del Virtual


Machine
Virtual
Machine
hypervisor Hypervisor
Host OS
Elimina los ciclos del hypervisor AMD-V

ocupados en administrar páginas sombra VM1 VM2


Process 1 Process 2
– Hasta 75% del tiempo del hypervisor
Reduce el tiempo de intercambio en 25%
– Tiempo de intercambio: el viaje al
hypervisor y su regreso Machine Memory

¡Puede mejorar significativamente el rendimiento en


muchas cargas virtualizadas!
23
Beneficios de AMD Virtualization
Rapid Soporte a
Lo mejor

Virtualization Live
Best

Indexing Migration
Soporte a
Arquitectura
Live
Direct
Migration Connect
Mejor

Tagged
VT DEV AMD-V™
TLB
Bueno

Rendimiento Seguridad Soporte a Rendimiento Seguridad Soporte a


software software

Intel AMD

AMD lleva la delantera en todos los aspectos relevantes


de la virtualización
24
El Quad Core en funcionamiento

Consideraciones del software de múltiples subprocesos


Mejoras en Mejoras en
Se requiere que el software sea rendimiento por
hardware
rendimiento por
software
codificado adecuadamente Software

para aprovechar los múltiples


optimado

núcleos
Las herramientas de desarrollo

Performance
pueden ayudar a generar
aplicaciones de múltiples
subprocesos Software sin
optimar
− Compiladores
− Java
− MSFT .NET Framework
− Bibliotecas 1 Núcleo 2 Núcleos 4 Núcleos Multinúcleos
Cantidad de núcleos

25
El Quad Core en funcionamiento

Transición
lenta Transición hasta
nuevos desarrollos
Transición rápida
Archivo/ Correo /
Impresión Mensajería
Servidores SMB Servidor de
Proxy/Cache OLTP
aplicaciones ERP
Servicios Web
Interfaz
Clúster de HPC Consolidación

Interfaz de Virtualización
base de datos CRM
Soporte de
decisiones
Servidores
departamentales SMP HPC

Análisis de negocios/
Inteligencia

Requerimientos de rendimiento

26
El Quad Core en funcionamiento

1
Procesador
Archivo/Impresión 2
Servidores SMB Procesadores
Proxy/Caché Correo / Mensajería

Servidor de
Servidores
4
aplicaciones
departamentales

Clúster de HPCProcesadores
Interfaz de Soporte a
base de datos Virtualización decisiones

Análisis de negocios / 8
Servicios Web
Inteligencia Procesadores
CRM
OLTP
ERP SMP HPC
Consolidación
Infraestructura de grid

Base de datos
muy grande

Requerimientos de E/S y memoria

27
El Quad Core en funcionamiento
Entornos de múltiples subprocesos

Aplicaciones concurrentes
• Varios Sos y aplicaciones en
ejecución en hardware
virtualizado
• Varios programas en ejecución
como una solución integrada

Entornos transaccionales
• Albergar sesiones de usuarios remotos
• Servidores Web y, en su caso, de
aplicaciones que procesen varias
transacciones

28
Creación de software de
múltiples subprocesos

GNU

Software

AMD está trabajando con los líderes de la industria para


desarrollar compiladores y herramientas que generan código
óptimo para los procesadores AMD64, incluso el núcleo
cuádruple
29
Gracias

También podría gustarte