Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TD MXC Amd Tech Session Garza
TD MXC Amd Tech Session Garza
Mayo de 2008
CONFIDENTIAL
El núcleo adelantado
AMD Wide Floating Point Punto flotante de 128 Bits Rendimiento mejorado de
(Ductería completa) punto flotante
Accelerator
AMD Memory Optimizer Acceso a la memoria, uso Mayor rendimiento
de los núcleos
Technology
AMD Balanced Smart Cache Cache L1/L2/L3, balanceo Mayor rendimiento,
entre dedicado y menor hiperpaginación
compartido
3
Procesador AMD Opteron™ Quad-Core
Coadyuva en la consolidación y
Virtualización la flexibilidad del cómputo con
óptima la mejor arquitectura x86 y
soporte a la plataforma
AMD Balanced Smart Cache Mejora la eficiencia de los núcleos para obtener un
mejor apoyo para entornos Improves core
efficiency for better support of multi-threaded
virtualization environments.
Hyper
Memory
Transport
Controller
Interface
FSB HyperTransport
PCI / PCI-e
PCI / PCI-e
Chipset
Memory
Chipset
Controller
Quad-Core Xeon MP “Tigerton”
MCP MCP MCP MCP
SRQ SRQ
Crossbar Crossbar
Mem.Ctrlr HT Mem.Ctrlr HT
8 GB/S
PCIe PCIe
Bridge Bridge
8 GB/S
USB
I/O Hub
PCI
9
November
Dual Dynamic Power Management™
Placa con un plano de energía único Con Dual Dynamic Power Management
Energía
Acometida Núcleos de la CPU Núcleos
única de
energía Controlador Controlador
de memoria
Energía de
de memoria
la memoria
10
Mejoras al manejo de energía
with Enhanced AMD PowerNow!™
Dual-core Multi-chip Module Native Quad-core
75% 35%
75% 35%
CORE 0 CORE 1
CORE 0 CORE 1
10% 1%
CORE 2 CORE 3
de banda
Processor with DDR2
Precargador de DRAM
• Predice y recopila inteligentemente los datos necesarios de la
memoria principal; no corrompe la jerarquía de la cache
12
1. Comparado con procesadores AMD Opteron de segunda generación y con la
misma frecuencia de reloj.
Mejoras a la potencia de la plataforma
Tecnología Enhanced
AMD PowerNow!™ con
Independent Dynamic Diseño nativo QuadCore
Tecnología de
Core Technology
procesamiento Para mejorar el rendimiento por
avanzado Puede reducir vatio sin aumentar el consumo
dinámicamente el de energía máximo
Silicio Sobre Aislante consumo de energía
(SOI) hasta un 75% Tecnología CoolCore™
Rápidas transiciones con Reduce la energía al apagar
bajas pérdidas de energía secciones sin usar de la CPU
13
Beneficio del núcleo cuádruple nativo:
Mejor intercambio de datos
Situación: El núcleo 1 necesita datos de la caché del núcleo 3, ¿cómo los obtiene?
Northbridge
14
Noviembre, 2007
Caché inteligente balanceado de AMD
Balanced
AMD Balanced Smart Cache
Mejor soporte a entornos multitarea
L1 L1 L1 L1
L1 L1 L1 L1
x x
L2 L2 L2 L2
L2 L2
L3
Bus frontal
Controlador de memoria integrado Controlador de memoria externo
• El núcleo 1 ejecuta una gran carga de • El núcleo 1 ejecuta una gran carga de trabajo
trabajo (>4MB), de modo que necesita toda (>4MB), de modo que necesita de toda la
la caché L3 y acceder a la memoria cache L2 y acceder a la memoria principal
principal • El núcleo 2 no puede hacer nada (a esto se le
• Los núcleos 2, 3 y 4 también podrán llama “thrashing”)
ejecutar cargas menores • Lo mismo puede suceder entre los núcleos 3
y 4 (más trashing
15 Barcelona Pre-Launch Training Overview
Noviembre, 2007
Medidas reales de consumo de energía
en la memoria
Fuertes penalizaciones de energía y calor
en capacidades de memoria con el uso de FBDIMM
120w
Con 8 DIMMs;
FBDIMM consume 100w
~83 vatios en
modo INACTIVO
Sólo ~14 vatios se 80w
consumen en
DDR2 60w
40w
8x FBDIMMs
consumen más de 20w
100w en carga
total vs. sólo 0w
~37w en DDR2 SPECcpu2000 SPECcpu2000
IDLE Power SPECjbb2005
INT FP
8x DDR2 (AMD) 14.32 33.68 29.24 36.94
8x FBDIMM (Intel) 83.34 95.49 90.21 101.2
1GB DDR2-667 DIMM: 1GB 667 FB-DIMM:
Brand: Micron Brand: ATP
Model: MT18HTF12872Y-667D6 Model: AP28K72S8BHE6S
16
Comparación de energía en plataforma QuadCore
Consumo proyectado de energía en una plataforma (8xDIMMs)
8xDIMMs
4xDIMMs
83.2W
17.6W 68W
15W
32.4W
4xDIMMs
50W 50W
Quad-Core Intel Xeon Serie 5300 Procesador AMD Opteron™ “Barcelona” QuadCore
• 100w por los procesadores (50w TDP) • 136w en los procesadores (68w POTENCIA MAX)
• 44w del chipset • 15w del chipset
$por/año
(un servidor)
$320 228W $por/año
(un servidor) $261 186W
778 BTU/Hr 635 BTU/Hr
$por/año
$159,782
23% $por/año $29,293
(500 servs.) $130,489 DE AHORRO
Más (500 servs.)
Los estimados de energía incluyen la alimentación de energía y el enfriamiento a un 60%, Costo de la energía: $0.10/KW-hr, basado
en las actuales especificaciones disponibles públicamente de procesador y chipset y estimados de AMD. Este ejemplo se presenta sólo
con propósitos informativos, los resultados reales pueden variar. Hay otros factores que afectan el consumo y costo reales.
17
Impacto proyectado de infraestructura del Quad Core
A escala de estante (Rack)
Energía determinada de 7Kw 7Kw Power Budget
• Los procesadores AMD Opteron de segunda
generación tienen una ruta planeada de 10%
14%
desper.
actualización a cuádruple núcleo con el desper.
mismo consumo de energía. Clovertown
eleva los requerimientos térmicos y de
energía en cada banda de energía.
18
Impacto de infraestructura de Quad Core
Escala de Centro de datos
Presupuesto de energía Mayor calor y
del centro de datos Procesadores
consumo de
Fácil transición a energía que puede
AMD Opteron™
7 Megavatios obligar a costosas
de segunda
10%
14% de
actualizaciones
generación de
Dual Core Quad Core las espaciocon
instalaciones:
una actualización
100 Racks 100 Racks desperdiciado
planeada a quad
8000 núcleos 16,000 núcleos con Xeon XeonDual
$ Ampliación a las
con
coreinstalaciones
en el mismo
Quad
$plano
Costo Core Core y
térmico
de electricidad
$ Distribución de
de consumo
energía
de
Dual-core energía
$ Equipamiento HVAC
90 Racks
Poder
6840 núcleos limitado
Difícil
transición a
Quad-core
Quad-core
85 Racks PODER
LIMITADO
12,240 núcleos
Wattage based on 2P systems, 8 DIMMs, TDP wattage for „Dempsey‟, „Woodcrest‟ & „Clovertown‟ is estimated based on current publicly available processor and chipset
values, AMD estimates, and an incremental 100watts for fans, storage, and power supply. (see, eg: http://techreport.com/etc/2006q2/woodcrest/index.x?pg=2 and is
subject to change. The examples contained herein are intended for informational purposes only. Other factors will affect real-world power consumption.
19
Liderazgo de AMD Virtualization™
Alto rendimiento
La arquitectura Direct Connect
Rapid Virtualization Indexing
Tagged TLB
Muy seguro
DEV (Device Exclusion Vector)
Soportado en software
AMD-V™ Extended Migration
Soporte a SOs sin modificación
Robusto ecosistema de Software
Con Virtualization
Sin VM1 VM2
Virtualización Memoria virtual 1 Memoria virtual 2
Memoria virtual
Virtualization Live
Best
Indexing Migration
Soporte a
Arquitectura
Live
Direct
Migration Connect
Mejor
Tagged
VT DEV AMD-V™
TLB
Bueno
Intel AMD
núcleos
Las herramientas de desarrollo
Performance
pueden ayudar a generar
aplicaciones de múltiples
subprocesos Software sin
optimar
− Compiladores
− Java
− MSFT .NET Framework
− Bibliotecas 1 Núcleo 2 Núcleos 4 Núcleos Multinúcleos
Cantidad de núcleos
25
El Quad Core en funcionamiento
Transición
lenta Transición hasta
nuevos desarrollos
Transición rápida
Archivo/ Correo /
Impresión Mensajería
Servidores SMB Servidor de
Proxy/Cache OLTP
aplicaciones ERP
Servicios Web
Interfaz
Clúster de HPC Consolidación
Interfaz de Virtualización
base de datos CRM
Soporte de
decisiones
Servidores
departamentales SMP HPC
Análisis de negocios/
Inteligencia
Requerimientos de rendimiento
26
El Quad Core en funcionamiento
1
Procesador
Archivo/Impresión 2
Servidores SMB Procesadores
Proxy/Caché Correo / Mensajería
Servidor de
Servidores
4
aplicaciones
departamentales
Clúster de HPCProcesadores
Interfaz de Soporte a
base de datos Virtualización decisiones
Análisis de negocios / 8
Servicios Web
Inteligencia Procesadores
CRM
OLTP
ERP SMP HPC
Consolidación
Infraestructura de grid
Base de datos
muy grande
27
El Quad Core en funcionamiento
Entornos de múltiples subprocesos
Aplicaciones concurrentes
• Varios Sos y aplicaciones en
ejecución en hardware
virtualizado
• Varios programas en ejecución
como una solución integrada
Entornos transaccionales
• Albergar sesiones de usuarios remotos
• Servidores Web y, en su caso, de
aplicaciones que procesen varias
transacciones
28
Creación de software de
múltiples subprocesos
GNU
Software