Está en la página 1de 8

MICROARQUITECTURA

INTEL XENON SCALABLE PROCESSORS

El nuevo diseño incorpora un nueva micro-arquitectura de núcleos (arquitectura de malla


Intel) que es una superautopista del centro de datos que permite tener una mayor eficiencia
para ofrecer el mejor rendimiento con la inversión realizada y además de maximizar los
resultados dentro de las limitaciones de espacio y consumo existentes, nuevas
interconexiones en la placa y controladores de memoria, Tecnología Intel
QuickAssist (Aceleración de hardware basada en el chipset para las cargas de trabajo
criptográficas y de compresión), junto con un amplio abanico de tecnologías recientemente
integradas fruto de la colaboración con un amplio abanico de socios, para optimizar el
rendimiento de las aplicaciones en esta nueva plataforma (como ejemplo la colaboración
con SAP para garantizar que la plataforma SAP HANA funcionaría con el máximo
rendimiento).

El procesador Intel Xeon Scalable cuenta con un nuevo núcleo construido desde cero para
satisfacer las diversas necesidades de carga de trabajo y el rápido crecimiento de la era
basada en datos. La familia de procesadores ofrece hasta 28 núcleos y 56 subprocesos por
procesador, lo cual representa un aumento del 50 por ciento en los canales de memoria y
20 por ciento más carriles PCIe, en contraste con la generación anterior, y brinda hasta 2
veces el número de flops/ciclos con las extensiones Intel® Advanced Vector Extensions 512
(Intel® AVX-512) (en comparación con Intel® Advanced Vector Extensions 2 (Intel® AVX2)),
lo cual permite grandes ganancias en mucha aplicaciones informáticas de alto rendimiento
y es el fundamento para cargas de trabajo emergentes, como la inteligencia artificial.

En conclusión La nueva arquitectura de las interconexiones con topología de malla ofrece


un marco muy poderoso para la interconexión de los diferentes componentes – núcleos,
caché, memoria y subsistema de E/S – de la familia escalable de procesadores Intel Xeon.
Esta arquitectura innovadora permite obtener mejoras en rendimiento y eficiencia en la
más amplia variedad de escenarios de uso, así como la base para unos avances contantes
tanto por parte de Intel como de su ecosistema mundial inigualable, para proporcionar unas
soluciones que ofrecen la capacidad informática y la eficiencia que esperan los clientes de
los centros de datos.

AMD EPYZ PROCESSORS

Los nuevos procesadores se basan en la microarquitectura Zen 2 de AMD, y presentan un


nuevo y revolucionario ecosistema “chiplet”, en el que un troquel de E/S de 14nm se
encuentra en el centro del procesador, rodeado por ocho módulos de chiplet de CPU de
7nm. Los chiplets están interconectados con el troquel de E/S, a través de la arquitectura
Infinity Fabric de segunda generación de AMD. Cada chiplet lleva hasta ocho núcleos y 16
hilos, de forma que los ocho suman el total de 64 núcleos.

Los procesadores EPYC Rome están equipados con un controlador de memoria DDR4 de
ocho canales, que ahora se encuentra dentro del propio troquel de E/S. Gracias a este
diseño mejorado, se obtiene una arquitectura UMA y cada chiplet puede acceder a la
memoria con la misma latencia. También son los primeros procesadores que admiten el
estándar PCIe 4.0 y tienen hasta 128 líneas PCIe 4.0, lo que los convierte en el compañero
ideal de los aceleradores Instinct MI60 y MI50 que utilizan la interfaz PCIe 4.0 x16. Sin
embargo, AMD no especificó si el complejo PCIe reside dentro del troquel de E/S

ARM THUNDER X2

Existen numerosas arquitecturas ARM distintas, según los usos para las que han sido
pensadas, las características extra, y su antigüedad. En esta sección tratamos de resumirlas
para comprobar que es un juego reducido y eficiente. Las arquitecturas v1 a v4, con
numerosas variaciones cada una, son las bases de todos los procesadores desde el ARM2,
el ARM4, el ARM5, ARM6 y ARM7, también con todas sus variaciones. Esta arquitectura
tiene tres etapas de pipeline, como se ve en la figura relacionada. Es constante para todas
las instrucciones excepto para los loads múltiples usados para salvar el estado de la
máquina. Además el desplazador está en serie con el resto de la ALU, y se ha implementado
de forma que no aumenta el tiempo de ejecución, por lo que se reduce el número de
instrucciones para hacer una operación. Esto implica un código denso y menos accesos a
memoria. También ayuda a que el número de accesos baje el que todas las instrucciones
sean de longitud constante, lo que simplifica la lógica del contador de programa. Los
accesos a memoria se reducen aún más al implementarlos relativos al contador de
programa o a otro registro, lo que permite una indexación precisa y un amplio rango de
memoria accesible sin redirecciones. Por último, el principal rango de esta arquitectura es
su ejecución condicional integrada en la decodificación. Las instrucciones se compilan con
códigos de condición referentes al registro de estado, que se comprueban para saber si la
instrucción debe ejecutarse. Los códigos son complejos como para tener en cuenta todas
las condiciones lógicas posibles de ejecución condicional.

PERFORMANCE O RENDIMIENTO

INTEL XENON SCALABLE PROCESSORS

Intel anunció que se rompieron 95 récords mundiales de rendimiento1 con sus procesadores
Intel® Xeon® Scalable, utilizando los benchmarks más actualizados de los organismos
estándar de la industria. Estos récords mundiales se lograron en servidores de los más
importantes fabricantes de equipo original, que van de los sistemas de un solo conector
hasta los de ocho.

La continua explosión de datos y la necesidad de procesarlos, almacenarlos, analizarlos y


compartirlos, está impulsando la innovación de la industria y la increíble demanda de
rendimiento informático en la nube, la red y la empresa. Ofrecer un desempeño de récord
mundial en la CPU permite que las empresas aceleren sus operaciones e incrementen la
productividad. El uso de los procesadores Intel Xeon Scalable en los centros de datos en la
nube, las empresas y hasta cómputo perimetral, permite que los clientes construyan una
infraestructura rápida, de alto rendimiento y de bajo consumo de energía.

Los procesadores Intel Xeon Scalable brindan un desempeño que bate récords
mundiales en una variedad de plataformas de servidor, que van de las cargas de trabajo
de informática generales que se ejecutan en sistemas de un solo conector hasta la
informática técnica avanzada y las cargas de trabajo de analítica de grandes datos que se
ejecutan en sistemas de ocho conectores. Todos los sistemas probados comprenden
mitigaciones para Spectre y Meltdown.

AMD EPYZ PROCESSORS

El rendimiento acelerado proviene de un compromiso con un mayor paralelismo. Con un


máximo de 64 núcleos por características SOC y "Zen 2", la serie AMD EPYC 7002 supera a
la 1.a generación Procesador AMD EPYC con canales de ejecución mejorados, velocidades
de reloj más altas y hasta 4x el caché de nivel 3 compartido. El resultado es más del doble
del rendimiento3 y hasta 4x las operaciones teóricas de coma flotante máxima por
segundo5 (FLOPS) en comparación con el 1er Procesadores Gen AMD EPYC. Los
procesadores reclaman un rendimiento récord mundial en los principales puntos de
referencia de la industria que incluyen SPEC CPU® 20172, TPC®7 y VMware® VMmark® 3.18.
Combinando estos innovadores procesadores con los primeros 7 nm del mundo acelerador
de GPU de proceso, el AMD Radeon Instinct ™ MI50 y MI60, puede acelerar HPC, análisis de
datos, artificial inteligencia y cargas de trabajo de aprendizaje automático. Porque nuestro
7nm La tecnología reduce el tamaño de cada núcleo de CPU. el mismo nivel de rendimiento
con aproximadamente la mitad de la energía consumo 6. La combinación de DIMM DDR4-
3200 y más ancho de banda de memoria aumenta el flujo de datos entre memoria y el
procesador para que sus aplicaciones puedan acceder información más rápida y acortar el
tiempo a los resultados.

ARM THUNDER X2

Núcleos personalizados de alto rendimiento totalmente fuera de servicio (OOO),


configuraciones de zócalo simple y doble. El SoC basado en el brazo debe ser
completamente coherente en caché a través de sockets duales utilizando la interconexión
de procesador coherente de Cavium (CCPI2 ™) La mayor capacidad de E / S integrada con
cientos de gigabits de ancho de banda de E / S utilizando SerDes integrado de 25 Gbps
Múltiples controladores de memoria DDR4 de 72 bits capaces de soportar memorias de
servidor de más alto rendimiento con 1 + TB de memoria en una configuración de doble
socket. Cientos de aceleradores de hardware integrados para aplicaciones de seguridad,
almacenamiento, redes y virtualización. Virtualización en todas partes con la tecnología
Cavium virtSOC ™: solución de virtualización de nivel de sistema completo y baja latencia
desde el núcleo hasta la E / S. Soporte para PCIe Gen3 x16 junto con puertos integrados IO
y SATAv3

ESQUEMAS DE COHERENCIA DE CACHES Y MEMORIAS


La información con la que opera un procesador se encuentra en una memoria interna muy
reducida conocida como “los registros”. Esta pequeña memoria no puede albergar toda la
información requerida por un programa, por lo que se requiere una memoria externa
adicional. La memoria es la parte del ordenador en la que se guardan o almacenan los
programas (las instrucciones y los datos). Sin una memoria de la que los procesadores
leyeran o escribieran la información, no habría ordenadores digitales de programa
almacenado y la memoria caché es una pequeña memoria situada entre el procesador y la
memoria principal, que, aunque muy rápida, solamente dispone de unos cuantos kilobytes
de capacidad.

INTEL XENON SCALABLE PROCESSORS: Memoria Integrada DDR3 y Memoria Cache


12 Mb con Gran Memoria de II Nivel.
AMD EPYZ PROCESSORS: Memoria Integrada 8 DIMM y Memoria Cache de I y II
Nivel Independiente comparte memoria cache III Nivel.

ESQUEMAS DE MULTITHREADING

INTEL XENON SCALABLE PROCESSORS:

La tecnología Hyper-Threading Intel® (Intel® HT) utiliza los recursos del procesador de
manera más eficaz, posibilitando que se ejecuten múltiples subprocesos en cada núcleo.
Como característica del desempeño, también aumenta la capacidad de procesamiento, lo
que a su vez se traduce en un aumento del desempeño general del software de varios
subprocesos. Con esto es posible:
Ejecutar aplicaciones exigentes al mismo tiempo y mantener la capacidad de
respuesta del sistema
Mantener la protección, eficiencia y facilidad de administración de los sistemas, al
tiempo que se reduce a un mínimo el impacto en la productividad
Disponer de un margen de ampliación para acompañar el futuro crecimiento de la
empresa e incorporar nuevas funciones de la solución

AMD EPYZ PROCESSORS:

Estos basan en la patente de 1994 de Sun Microsystems llamada MultiThreading, que permite
duplicar las unidades lógicas de cada núcleo, es decir, permite a un núcleo realizar dos tareas
simultáneas. Esto significa que un procesador de dos núcleos sería capaz de realizar cuatro
tareas simultáneas, por lo que se dice que tiene cuatro hilos de proceso (thread = hilo)

ARM THUNDER X2

El multihilo dependiendo de cómo diseñe procesadores para diferentes segmentos del


mercado. La implementación inicial podría ser en procesadores para el espacio de redes, El
subprocesamiento múltiple ayudará a los procesadores de red a procesar datos más rápido
y a hacer un trabajo más eficiente de direccionamiento de memoria para aplicaciones de
red.

ESQUEMAS DE INTERCONEXIÓN DE BUSES INTERNOS

Estos Procesadores se caracterizan por la cantidad de información que se transmite en


forma simultánea. Este volumen se expresa en bits y corresponde al número de líneas físicas
mediante las cuales se envía la información en forma simultánea. Un cable plano de 32 hilos
permite la transmisión de 32 bits en paralelo. El término "ancho" se utiliza para designar el
número de bits que un bus puede transmitir simultáneamente. Un equipo con un bus de 8
bits de datos, por ejemplo, transmite 8 bits de datos cada vez, mientras que uno con un BUS
de 16 bits de datos transmite 16 bits de datos simultáneamente. Como el BUS es parte
integral de la transmisión interna de datos y como los usuarios suelen tener que añadir
componentes adicionales al sistema, la mayoría de los buses de los equipos informáticos
pueden ampliarse mediante uno o más zócalos de expansión (conectores para placas de
circuito añadidas). Al agregarse estas placas permiten la conexión eléctrica con el BUS y se
convierten en parte efectiva del sistema.

SOPORTE PARA INSTRUCCIONES VECTORIALES

INTEL XENON SCALABLE PROCESSORS:

Con las innumerables prestaciones de operaciones vectoriales de 512 bits que ofrece, Intel
tiene capacidad para gestionar sus tareas informáticas más exigentes. Las aplicaciones
incluyen hasta 32 operaciones de coma flotante de precisión doble y 64 de precisión simple
por segundo y ciclo de reloj en vectores de 512 bits, así como ocho enteros de 64 bits y
dieciséis de 32 bits, con hasta dos unidades combinadas de multiplicación y suma de 512
bits (FMA) que, por tanto, duplican tanto el ancho de los registros de datos como el número
de registros y el ancho de las unidades FMA.

Los Otros procesadores se basan en la arquitectura RISC (Reduced Instruction Set


Computer) y se caracteriza porque ofrecen la posibilidad de ejecutar procesos paralelos de
forma más corta y por lo tanto con un ahorro de energía. Esto, como ya pensarás, se traduce
en que son ideales para equipos portátiles, ya sean tabletas o móviles.

REFERENCIAS UTILIZADAS

Intel.la

Hardzone.es

Pcworld.com

Bdigital.unal.edu.co (Comparación y análisis de desempeño de unidades de procesamiento)

Academia.edu (comparación de la arquitectura de los microprocesadores)

También podría gustarte