AMD ha afirmado que su actual silicio para centros de datos ya es más del doble de rápido y hasta 2,75 veces más eficiente que los superchips de CPU Grace de Nvidia. Las afirmaciones de la empresa de diseño de chips se produjeron después de sus propias pruebas, publicadas la semana pasada, en las que consideró el superchip de CPU Grace 2022 de Nvidia. Ese producto combina un par de matrices de CPU que contienen 72 núcleos Arm Neoverse V2 cada uno, los conecta con una interconexión de chip a chip NVLink de 900 GB/seg y lo respalda con hasta 960 GB de memoria LPDDR5x rápida. Sin embargo, parece que AMD estaba probando la versión de 480 GB. Para ser claros, este no es el superchip Grace-Hopper de Nvidia (GH200) que combina una sola CPU Grace con hasta 480 GB de LPDDR5x y una matriz de GPU H100 de 144 GB. AMD enfrentó a la CPU Grace de Nvidia con un sistema de uno y dos sockets que ejecutaban un Epyc 4 Genoa (9654) y un Bergamo (9754), cada uno con 768 GB de memoria DDR5 4800MT/seg. En diez cargas de trabajo (que van desde computación de propósito general, Java del lado del servidor, eficiencia energética, bases de datos transaccionales, sistemas de soporte de decisiones, servidores web, bases de datos en memoria, codificación de video y computación de alto rendimiento (HPC)), AMD se jactó de que su kit ofrecía entre 1,5 y 4 veces el rendimiento del chip de Nvidia. Tu experiencia puede variar Como ocurre con cualquier punto de referencia proporcionado por un proveedor, tómatelo con pinzas. Puedes encontrar un desglose más detallado de las afirmaciones de rendimiento de AMD aquí, pero aquí tienes una visión consolidada. Aquí hay una vista consolidada que muestra la supuesta ventaja de AMD sobre el superchip de CPU Grace-Grace de Nvidia – Haga clic para ampliar Mientras tanto, en el benchmark SPECpower-ssj2008, AMD afirmó que un solo Epyc 9754 de 128 núcleos ofrecía aproximadamente 2,5 veces mejor rendimiento por vatio que el chip basado en Arm Neoverse V2 de Nvidia, mientras que un par de Epycs de Bergamo llevaron esa ventaja a 2,75 veces. AMD también intentó disipar la creencia generalizada de que los sistemas Arm son más eficientes energéticamente por naturaleza, mostrando una ventaja de hasta 2,75 veces en rendimiento por vatio en algunas pruebas – Haga clic para ampliar Nada de esto debería sorprender a nadie que haya estado siguiendo el desarrollo de Grace, aunque la situación no es tan simple como AMD quiere hacernos creer. Como informó nuestro sitio hermano The Next Platform en febrero, los investigadores de las universidades de Stoney Brook y Buffalo compararon los datos de rendimiento del Superchip de CPU Grace de Nvidia y varios procesadores x86 recopilados de varios institutos de investigación científica y un desarrollador de la nube. Naturalmente, la mayoría de estas pruebas se centraron en HPC, incluidos Linpack, High Performance Conjugate Gradient (HPCG), OpenFOAM y Gromacs. Si bien el rendimiento del sistema Grace varió enormemente entre las pruebas, en el peor de los casos se ubicó en algún lugar entre la arquitectura Skylake de Intel (alrededor de 2015) y su tecnología Ice Lake (2019), superó al Milan de AMD (de 2021) y se quedó a poca distancia de un Xeon Max lanzado a principios de 2023. Los hallazgos sugieren que los procesadores Genoa y Bergamo Epyc más potentes de AMD podrían superar a la primera CPU de centro de datos de Nvidia, en el punto de referencia correcto. Pero como aludimos anteriormente, todo esto depende de la carga de trabajo. En su hoja de datos del superchip para CPU Grace, Nvidia muestra que el silicio logra entre un 90 por ciento y 2,4 veces el rendimiento de un Epyc 9654 dual de 96 núcleos (el mismo Genoa Epyc utilizado en las pruebas de AMD) y hasta tres veces el rendimiento en una variedad de servicios de nube y HPC. ¿Podrías mirar eso? Nvidia también puede preparar pruebas de rendimiento que parezcan favorables. Haz clic para ampliar ¿De qué se trata esto realmente? Si bien una buena y antigua comparación de CPU podría tener sentido (Grace y Epyc son, al fin y al cabo, ambas plataformas de CPU para centros de datos), realmente no hemos visto que los superchips para CPU Grace de Nvidia se hayan implementado ampliamente fuera de las aplicaciones de HPC, y generalmente en preparación para implementaciones a mayor escala del silicio GH200 de próxima generación. Las supercomputadoras Isambard-3 e Isambard-AI del Reino Unido son buenos ejemplos de esa estrategia en acción. La propia Nvidia anuncia el superchip de la CPU como uno que está diseñado para «procesar montañas de datos para producir inteligencia con la máxima eficiencia energética», y cita específicamente la IA, el análisis de datos, las aplicaciones en la nube a gran escala y las aplicaciones HPC. Es más, en la configuración GH200, la mayor parte de los cálculos los realiza la GPU; Grace mantiene el acelerador alimentado con datos. Y claramente Nvidia cree que Grace y su interconexión NVLink-C2C están a la altura de la tarea, ya que eligió reutilizar la CPU en sus próximos superchips GB200, que analizamos en la conferencia de desarrolladores GTC de Nvidia. Podría decirse que eso es todo lo que Nvidia necesita que haga Grace para tener éxito. Y explica por qué el campeón de la aceleración ya ha comenzado a trabajar en su sucesor. Tenemos que imaginarnos que la cantidad de personas que comparan Grace-Grace con Epyc de cuarta generación (fuera del ámbito de HPC, por supuesto) es una lista bastante corta. Sinceramente, nos habría interesado mucho más ver un duelo entre las APU GH200 y MI300A de AMD. AMD cierra sus afirmaciones con una discusión sobre la compatibilidad con Arm, un tema que merece muchas más pruebas comparativas. Tenemos la sensación de que las pruebas de AMD pueden ser simplemente un ejercicio para disipar los temores de que x86 se esté quedando sin fuerza y ​​que Arm esté tomando el control. Arm no es exactamente nuevo en la comunidad de HPC o en la nube, mercados que están lejos de rechazar la arquitectura. De hecho, todos los principales proveedores de nube de EE. UU. ahora tienen una CPU Arm para llamar suya. Pero si realmente se trata de cómo se comparan los núcleos Zen 4 y Zen 4c de AMD con la arquitectura Neoverse V2 de Arm, una comparación con Graviton4 de Amazon Web Service hubiera sido más útil. Imagen del folleto de AWS del procesador Graviton4: haga clic para ampliar Anunciado a fines de 2023, Graviton4 se basa en el mismo núcleo Neoverse V2 que Grace, pero cuenta con 96 núcleos y admite configuraciones estándar de doble socket y 12 canales de DDR4, a diferencia de los módulos LPDDR5x soldados de Grace. Las instancias que ejecutan Graviton4 han estado disponibles en vista previa durante meses y se volvieron disponibles para el público en general la semana pasada. Quizás lo más importante es que AWS ofrece instancias basadas en Epyc 4 y Graviton 4, lo que hace que la probabilidad de que alguien compare las dos sea mucho mayor. ®