Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El procesador Intel Xeon Scalable cuenta con un nuevo núcleo construido desde cero para
satisfacer las diversas necesidades de carga de trabajo y el rápido crecimiento de la era
basada en datos. La familia de procesadores ofrece hasta 28 núcleos y 56 subprocesos por
procesador, lo cual representa un aumento del 50 por ciento en los canales de memoria y
20 por ciento más carriles PCIe, en contraste con la generación anterior, y brinda hasta 2
veces el número de flops/ciclos con las extensiones Intel® Advanced Vector Extensions 512
(Intel® AVX-512) (en comparación con Intel® Advanced Vector Extensions 2 (Intel® AVX2)),
lo cual permite grandes ganancias en mucha aplicaciones informáticas de alto rendimiento
y es el fundamento para cargas de trabajo emergentes, como la inteligencia artificial.
Los procesadores EPYC Rome están equipados con un controlador de memoria DDR4 de
ocho canales, que ahora se encuentra dentro del propio troquel de E/S. Gracias a este
diseño mejorado, se obtiene una arquitectura UMA y cada chiplet puede acceder a la
memoria con la misma latencia. También son los primeros procesadores que admiten el
estándar PCIe 4.0 y tienen hasta 128 líneas PCIe 4.0, lo que los convierte en el compañero
ideal de los aceleradores Instinct MI60 y MI50 que utilizan la interfaz PCIe 4.0 x16. Sin
embargo, AMD no especificó si el complejo PCIe reside dentro del troquel de E/S
ARM THUNDER X2
Existen numerosas arquitecturas ARM distintas, según los usos para las que han sido
pensadas, las características extra, y su antigüedad. En esta sección tratamos de resumirlas
para comprobar que es un juego reducido y eficiente. Las arquitecturas v1 a v4, con
numerosas variaciones cada una, son las bases de todos los procesadores desde el ARM2,
el ARM4, el ARM5, ARM6 y ARM7, también con todas sus variaciones. Esta arquitectura
tiene tres etapas de pipeline, como se ve en la figura relacionada. Es constante para todas
las instrucciones excepto para los loads múltiples usados para salvar el estado de la
máquina. Además el desplazador está en serie con el resto de la ALU, y se ha implementado
de forma que no aumenta el tiempo de ejecución, por lo que se reduce el número de
instrucciones para hacer una operación. Esto implica un código denso y menos accesos a
memoria. También ayuda a que el número de accesos baje el que todas las instrucciones
sean de longitud constante, lo que simplifica la lógica del contador de programa. Los
accesos a memoria se reducen aún más al implementarlos relativos al contador de
programa o a otro registro, lo que permite una indexación precisa y un amplio rango de
memoria accesible sin redirecciones. Por último, el principal rango de esta arquitectura es
su ejecución condicional integrada en la decodificación. Las instrucciones se compilan con
códigos de condición referentes al registro de estado, que se comprueban para saber si la
instrucción debe ejecutarse. Los códigos son complejos como para tener en cuenta todas
las condiciones lógicas posibles de ejecución condicional.
PERFORMANCE O RENDIMIENTO
Intel anunció que se rompieron 95 récords mundiales de rendimiento1 con sus procesadores
Intel® Xeon® Scalable, utilizando los benchmarks más actualizados de los organismos
estándar de la industria. Estos récords mundiales se lograron en servidores de los más
importantes fabricantes de equipo original, que van de los sistemas de un solo conector
hasta los de ocho.
Los procesadores Intel Xeon Scalable brindan un desempeño que bate récords
mundiales en una variedad de plataformas de servidor, que van de las cargas de trabajo
de informática generales que se ejecutan en sistemas de un solo conector hasta la
informática técnica avanzada y las cargas de trabajo de analítica de grandes datos que se
ejecutan en sistemas de ocho conectores. Todos los sistemas probados comprenden
mitigaciones para Spectre y Meltdown.
ARM THUNDER X2
ESQUEMAS DE MULTITHREADING
La tecnología Hyper-Threading Intel® (Intel® HT) utiliza los recursos del procesador de
manera más eficaz, posibilitando que se ejecuten múltiples subprocesos en cada núcleo.
Como característica del desempeño, también aumenta la capacidad de procesamiento, lo
que a su vez se traduce en un aumento del desempeño general del software de varios
subprocesos. Con esto es posible:
Ejecutar aplicaciones exigentes al mismo tiempo y mantener la capacidad de
respuesta del sistema
Mantener la protección, eficiencia y facilidad de administración de los sistemas, al
tiempo que se reduce a un mínimo el impacto en la productividad
Disponer de un margen de ampliación para acompañar el futuro crecimiento de la
empresa e incorporar nuevas funciones de la solución
Estos basan en la patente de 1994 de Sun Microsystems llamada MultiThreading, que permite
duplicar las unidades lógicas de cada núcleo, es decir, permite a un núcleo realizar dos tareas
simultáneas. Esto significa que un procesador de dos núcleos sería capaz de realizar cuatro
tareas simultáneas, por lo que se dice que tiene cuatro hilos de proceso (thread = hilo)
ARM THUNDER X2
Con las innumerables prestaciones de operaciones vectoriales de 512 bits que ofrece, Intel
tiene capacidad para gestionar sus tareas informáticas más exigentes. Las aplicaciones
incluyen hasta 32 operaciones de coma flotante de precisión doble y 64 de precisión simple
por segundo y ciclo de reloj en vectores de 512 bits, así como ocho enteros de 64 bits y
dieciséis de 32 bits, con hasta dos unidades combinadas de multiplicación y suma de 512
bits (FMA) que, por tanto, duplican tanto el ancho de los registros de datos como el número
de registros y el ancho de las unidades FMA.
REFERENCIAS UTILIZADAS
Intel.la
Hardzone.es
Pcworld.com