Así es un Core de Zen 4 frente a Zen 3 ¿cómo afecta a los Ryzen 7000?

Poco a poco vamos conociendo detalles técnicos acerca de lo que Zen 4 como arquitectura nos podrá dar. En concreto, ya tenemos un desglose mucho más preciso del que dimos en su momento acerca de las cifras de IPC que AMD mostró, y, al mismo tiempo, también se ha desglosado la disposición de unidades dentro de un núcleo Zen 4 frente a uno Zen 3. ¿Hay muchos cambios dentro del chip? ¿Cómo afectan estos cambios en el Core de Zen 4 para con su rendimiento? No sabemos mucho, pero lo que hemos visto da para pensar realmente.

La presentación de AMD dejó una cifra que se quedó en la mente de todos: +13% de IPC, por lo que para entender la nueva disposición de cada núcleo una vez pasado por el microscópio de barrido electrónico, es importante comprender a qué corresponden las cifras luego dentro del silicio.

Una ganancia de IPC bastante dispar y sobre todo, muy elástica

AMD-Zen-4-13%-IPC-desglosado

Con elástica nos queremos referir al impacto en el rendimiento. Las cifras no están nada alejadas de las que dimos a groso modo y ojo de buen cubero, pero ahora son totalmente precisas, así que vamos con ellas en primer lugar sabiendo que son desgranadas desde el 13% en primer lugar, y dentro de este, el 100% de esa cifra:

  • Front End -> 5,182% o el 39,86% del total del 13% de IPC.
  • Load/Store -> 3,067% o el 23,59%.
  • Branch Prediction -> 2,673% o el 20,56% de la mejora del IPC.
  • Execution Engines -> 1,035% o el 7,96% del total.
  • L2 -> 1,053% o el 8,10% de la ganacia total de IPC.

¿Qué hay de interesante aquí que no sepamos? En principio y salvo sorpresa, el aumento de la caché L2 con un 1 y un 8% aproximadamente va a suponer que en benchmark sintéticos de CPU el rendimiento no despegue mucho, por lo que hasta ahora y en este caso, es una medida de ajuste para paliar latencia y no mermar rendimiento dado el salto en Front End.

Pero lo que no se ha mostrado ni dicho es que ese 1,053% del total es una de las grandes apuestas de AMD para gaming y es imprescindible por los motivos que vamos a ver a continuación.

Zen 4, núcleos más estrechos y alargados que condicionan la arquitectura

TSMC-5-nm-N5-características

Partimos de la base del nodo N5 de TSMC para saber, según la propia compañía, que la densidad lógica aumentó sobre el 80%, pero en cambio el área SRAM está siendo un problema (y lo será hasta el cambio a GAA), puesto que solo se ha escalado un 35%. El peor dato llega desde el área analógica, con solo un incremento de la misma del 20%.

Con estos datos en la mano, veamos la comparativa superior entre Zen 4 y Zen 3 a un núcleo. Lo más llamativo es que la estructura general se mantiene. Ahora tenemos un die más largo y menos ancho, lo que se da por el aumento de la caché L2 principalmente.

Zen-3-vs-Zen-4-area-núcleo-Core

Desgranando el die en los tres principales bloques, lo que vemos es que el apartado de la uCode ROM y FPU es casi idéntico en tamaño pese a contar con las unidades dedicadas a AVX-512. El núcleo duro y central reduce sus dimensiones totales de un 55,96% al 46,88% con ligeras modificaciones de la arquitectura que ahora trataremos, mientras que por último, el CPL más la L2 pasan de un 19,95% a un espectacular 27,91%.

Esto supone un incremento casi del un tercio con respecto a Zen 3 y lógicamente supone un gasto de área enorme pese a reducir TSMC el tamaño en un 35%. Esto que en principio puede resultar despreciable para el rendimiento es crucial para el gaming, puesto que la L2 está en gran parte ligada al rendimiento en Zen 4, dado que se evita salir a la L3 compartida, y por lo tanto, la latencia se reduce, se consume menos energía y hay un mejor ratio rendimiento/vatio.

Con ello se aumentan los FPS y se consigue que el tiempo a memoria también se reduzca al tener menos accesos a la RAM del sistema.  Más datos a tratar. Los Ops aumentan considerablemente y gracias al 20% de reducción del nodo se sitúan con un área poco mayor a la que tenía en Zen 3.

AMD-Zen-4-die-vs-Zen-3-die-núcleo-Core

Se destina mucho más espacio físico a la L1I y se reduce el área del Decode e Integrer Exe, todo pese a que una parte del rendimiento y subida del IPC viene de ahí. Por su parte, la L1D se reduce considerablemente, así que las optimizaciones en datos van a ser realmente interesantes de ver.

Por último, las unidades de ejecución se han unido en dos grandes bloques, la L2 ahora es más rectangular aprovechando el diseño del die y los Tags+State ahora son un gran grupo que se comparte con la L2, reduciendo la distancia y, en consecuencia, la latencia. Como era de esperar, el CPL ha supuesto una parte importante de esto y aumenta su tamaño para compensar las ganancias.

Primeros datos de AIDA64 en memoria DDR5 con Ryzen 7000

En términos de rendimiento y latencia, más allá de los MB/s que se consiga con la DDR5 y el aumento de frecuencia de los núcleos, el resultado en primer término que hemos podido ver es de 64,5 ns con DDR5-6000 a 40-40-40-76 CR2.

No es espectacular, pero implica una mejora muy interesante entre el IMC y la memoria, un adelanto de lo que está por llegar con la L1, L2 y L3 para su latencia. Es de esperar que esta sea menor que en Zen 3, ya que los Cores de Zen 4 aun manteniendo disposición como arquitectura, ahora tienen ciertas unidades más cercanas a las otras y eso va a repercutir no solo en una mejor eficiencia, sino en un tiempo de acceso mucho menor que debe verse reflejado en los primeros test para estos parámetros.

Tendremos que esperar a tenerlos enfrente para poder verlos, pero en memoria ya se aprecia un rendimiento bastante similar a memorias DDR4 que no están muy apretadas, y esto es solo el principio...