En el nuevo benchmark de Phoronix, Vera ofrece resultados ganadores de rendimiento y memoria para la IA agentiva.
El cambio hacia la IA agentiva crea un nuevo requisito de CPU para la fábrica de IA: núcleos rápidos, enorme ancho de banda de memoria y la capacidad de mantener un alto rendimiento cuando todos los núcleos están activos.
Los resultados iniciales de benchmarks publicados hoy por Phoronix demuestran que la CPU NVIDIA Vera cumple esta necesidad. Para este primer vistazo público, el alcance del benchmark se centró en las cargas de trabajo agentivas para las que Vera fue diseñada en el centro de datos moderno.
La CPU Vera entrega el rendimiento que las fábricas de IA necesitan mientras optimiza la potencia de la plataforma. Ochenta y ocho núcleos NVIDIA Olympus personalizados, 1,2 TB/s de ancho de banda de memoria y un fabric de alta velocidad integrado en el chip dan como resultado una plataforma de CPU que combina rendimiento de núcleos y ancho de banda de memoria en un eficiente sobre de potencia.
NVIDIA Olympus Ofrece un Rendimiento Agresivo
En el corazón de Vera se encuentran los núcleos de CPU NVIDIA Olympus personalizados. Totalmente compatibles con la arquitectura de conjunto de instrucciones Armv9.2, Olympus está diseñado para el trabajo secuencial de CPU que sustenta la IA agentiva: runtimes con muchas bifurcaciones, código en sandbox, procesamiento de datos y orquestación.
El die monolítico de Vera, sus núcleos amplios, la predicción avanzada de bifurcaciones y el NVIDIA Scalable Coherency Fabric de segunda generación ayudan a Vera a mantener el flujo de datos a través de los 88 núcleos.
Las pruebas de Phoronix con una CPU Vera de socket único —con un TDP de 450 vatios y menos de 30 vatios de potencia de memoria— mostraron que ofrece un rendimiento excepcional dentro de ese perfil de potencia, junto con mejoras generacionales en una amplia gama de cargas de trabajo que abarcan compilación de código, compresión de archivos, transcodificación de vídeo, Python, Java y gestión de bases de datos.
Estas son exactamente las tareas intensivas de CPU que los agentes y las fábricas de IA ejecutan a diario: compilar código, ejecutar runtimes, comprimir datos, consultar bases de datos y coordinar grandes pilas de software.
«Al empezar, realmente no sabía qué esperar de la Vera de NVIDIA con los nuevos núcleos Olympus», escribió Michael Larabel, fundador y autor principal de Phoronix. «Pero al final me di cuenta de que esta es la competencia más formidable para los procesadores Intel y AMD x86_64 que jamás se ha visto.»
‘Ventaja Increíble’ en Rendimiento de Memoria
Las cargas de trabajo agentivas no están limitadas únicamente por el número de núcleos. Necesitan alta utilización de núcleos y ancho de banda de memoria sostenido, lo que hace que el rendimiento de memoria por vatio sea una parte crítica de la eficiencia general de la CPU.
Vera incorpora un subsistema de memoria LPDDR5X de segunda generación, lo que permite un consumo de energía por bit dramáticamente menor en comparación con DDR5. Esto permite a Vera ofrecer hasta 1,2 TB/s de ancho de banda —hasta 2x el ancho de banda máximo de memoria en comparación con las CPU tradicionales, con menos de 30 vatios de potencia de memoria, frente a más de 100 vatios para el DDR5 tradicional.
En las pruebas Phoronix STREAM TRIAD, Vera mantuvo el 90% de su ancho de banda de memoria máximo —logrando el mayor porcentaje del ancho de banda máximo nominal de cualquier CPU probada por Phoronix— y entregó más de 4x el ancho de banda de memoria por núcleo en comparación con las CPU x86 tradicionales.
«La Vera de NVIDIA con su memoria LPDDR5X mostraba su increíble ventaja en rendimiento de memoria sobre los actuales procesadores Intel Xeon y AMD EPYC», escribió Larabel.
Sin embargo, el ancho de banda máximo es solo parte de la historia. Las cargas de trabajo de fábricas de IA ejecutan muchos sandboxes, llamadas a herramientas y servicios de datos al mismo tiempo. En pruebas independientes con Vera, Prime Intellect descubrió que Vera mantenía un alto ancho de banda y una latencia de memoria baja y consistente a medida que más cargas de trabajo se ejecutaban en paralelo —el tipo de rendimiento predecible necesario para la IA agentiva.
Un Gran Salto Generacional y Liderazgo en las Pruebas de Phoronix
En comparación con la CPU NVIDIA Grace de generación anterior, Vera entregó un aumento de 1,6x en la media geométrica en las pruebas de Phoronix —un increíble avance de generación en generación.
«La diferencia de Grace a Vera superaba consistentemente mis expectativas para el rendimiento generacional que solemos ver en los procesadores», escribió Larabel. «La CPU NVIDIA Vera con sus núcleos Olympus diseñados en casa acaba asestando un golpe contundente con una competitividad frente a las CPU Intel/AMD x86_64 que nunca había visto en ningún otro procesador ARM o no x86_64.»
Vera lideró el campo de CPU probadas, entregando una ventaja de rendimiento general de 1,5x en comparación con un procesador x86 de 128 núcleos de última generación. Las mejoras se manifestaron en cargas de trabajo prácticas para desarrolladores. Una Vera de socket único compiló un kernel de Linux predeterminado en solo 20 segundos, el resultado más rápido medido por Phoronix en esa prueba. Vera logró una compilación del kernel de Linux 2x más rápida por núcleo en comparación con un procesador de 128 núcleos.
«En términos de media [geométrica], la NVIDIA Vera entregó un 10% mejor rendimiento que el procesador AMD EPYC 9575F de 5,0 GHz de alta frecuencia», escribió Larabel.
Vera en Pruebas con Clientes, Próximamente Disponible de Socios
En NVIDIA GTC, NVIDIA anunció un amplio soporte del ecosistema para Vera, que abarca empresas nativas de IA, centros de supercomputación, proveedores de servicios en la nube y proveedores de infraestructura.
NVIDIA también ha entregado las primeras CPU Vera a las principales empresas de IA y proveedores de nube, lo que marca un hito importante a medida que Vera avanza hacia su disponibilidad con socios en la segunda mitad del año.
Vera estará disponible de los socios en sistemas de doble y single socket, con opciones de refrigeración por aire y refrigeración líquida para soportar implementaciones de fábricas de IA, desde centros de datos empresariales estándar hasta infraestructura de IA agentiva de alta densidad.
Obtenga más información sobre NVIDIA Vera.
