Tutoriales

GDDR6X vs GDDR6 – Diferencias técnicas y rendimiento

Nvidia ha sido hasta ahora la primera marca en implementar las memorias VRAM más novedosas de cada generación. Lo hizo con las GDDR6 en 2019 y han vuelto a hacerlo a finales de 2020 con las nuevas GDDR6X, una versión exclusiva de Micron que lleva aún más lejos el rendimiento. Así que veremos cuáles son las diferencias entre GDDR6X vs GDDR6, así como las prestaciones de las versiones existentes.

Memoria RAM dedicada en GPU

En el calendario de lanzamientos, por ahora Nvidia siempre ha adelantado a AMD en los modelos nuevos. Esto por un lado ha beneficiado a la marca verde en cuanto a lanzamiento de novedades como fue en su día con las GDDR6 y ahora las peculiares GDDR6X. Pero por otro lado le permite a AMD saber con antelación qué ha hecho su rival para responderle de forma más certera.

Toda tarjeta gráfica dedicada que se precie debe de tener su propia memoria. Pero esta no es simplemente una memoria RAM o derivada de ella, funciona de forma distinta como ya se puede intuir viendo las especificaciones. Estos chips alcanzan frecuencias efectivas por encima de los 14 Gbps, bajo un reloj de 1750 MHz en el caso de las GDDR6 y de 19 Gbps en las GDDR6X con una frecuencia de reloj de solo 1219 MHz. En su condición de memoria DDR (Double Data Rate), serán memorias capaces de transferir datos por dos canales distintos en un mismo ciclo de reloj.

Pero a diferencia de la memoria RAM de una CPU, le memoria de una GPU debe potenciar ante todo la velocidad en la copia de instrucciones y el ancho de banda. ¿Por qué? Pues debido al tipo de datos con los que trabaja, es decir, gráficos en 3 dimensiones creados por triángulos y con efectos de rasterizado. La memoria gráfica va a ser del orden de 2 a 4 veces más lenta en lectura y escritura frente a la RAM, pero superan en 10 veces la capacidad de copia. Y mientras que el ancho de bus de una RAM es de 64 bits (128 bits en Dual Channel) una VRAM llega hasta los 384 bits en las versiones más potentes.

En esta ocasión no hablaremos de las memorias de tipo HBM2 (High Bandwidth Memory), las cuales utilizan un ancho de bus mucho mayor pero frecuencias más bajas. Son más caras que las de tipo GDDR, pero mejores en tareas de inteligencia artificial por ser capaces de transferir mucha mayor cantidad de información en cada ciclo de reloj. Y es que su ancho de banda se eleva hasta los 2048 o hasta 4096 bits, habiéndose destinado principalmente a tarjetas de servidores tras el fracaso en las Radeon Vega y Radeon VII de AMD.

GDDR6

Empezamos viendo la memoria GDDR6 o Graphics Double Data Rate, un modelo para gráficos síncronos de acceso aleatorio con el mismo fundamento que el utilizado en las memorias RAM habituales. La primera diferencia entre la GDDR6X vs GDDR6 es que esta última pertenece a un estándar JEDEC, mientras que GDDR6X es un proyecto propio de Micron.

Dónde se utilizan las GDDR6

Como tal, GDDR6 son unos chips fabricados por distintas marcas actualmente, como Samsung, Micron o SK Hynix, y cada ensamblador opta por la que crea oportuna. Salvo la calidad en cada chip y su capacidad de overclock, el funcionamiento de ellos es básicamente el mismo, aunque cada fabricante opta por un proceso de fabricación y una velocidad. Esta memoria nos ofrece un importante incremento de ancho de banda por pin respecto a GDDR5, hablamos de hasta 16 Gbps frente a los 8 Gbps de GDDR5. Además, lo hace a voltajes operativos de 1,35 V.

Nvidia RTX 3070

El proceso de fabricación de los distintos chips ha ido asociado a las tasas de transferencia. Samsung fue el primero de los fabricantes en anunciar sus chips, los cuales utilizaban un proceso de 10 nm y alcanzaban los 16 Gbps. Pero como ya sabréis, las primeras tarjetas gráficas Nvidia RTX 20 trabajaban con chips SK Hynix de 14 Gbps bajo un proceso de 21 nm. Micron también hizo lo propio con la producción en masa de estos chips, encontrándolos también en modelos de ensambladores. Las capacidades van desde los 4 GB a 8 GB excepto la RTX 2080 Ti que sube a 11 GB y 15,5 Gbps de transferencia. Las tarjetas Nvidia RTX 30 Ampere por debajo de la RTX 3070, siguen utilizando memorias GDDR6 a 14 Gbps y en bloques de 8 GB.

AMD Radeon RX 6900 XT

AMD por su parte descartó las memorias HBM2 por ser bastante caras en comparación con las GDDR6 y ya en la arquitectura RDNA empezó a utilizarlas para todos sus modelos. Al igual que Nvidia, los chips equipados en las RX 5000 operan a 14 Gbps con una capacidad de 8 GB en sus modelos. Actualmente las tarjetas AMD Radeon RX 6000 RDNA están utilizando chips GDDR6 a 16 Gbps en bloques de 16 GB, alcanzando así el objetivo real de estos chips llevados a su máximo rendimiento.

PS5

Finalmente, la memoria GDDR6 está presente en otros escenarios como es el de las consolas de videojuegos de nueva generación. La consola de Microsoft, Xbox Series X, utiliza una capacidad total de 16 GB GDDR6 en bus de 320 bits. Esta se divide en 10 GB @ 560 GB/s y 6 GB @ 336 GB/s para gráficos y procesamiento respectivamente. Por parte de la consola de SONY, la PS5, utiliza igualmente 16 GB GDDR6 de capacidad, pero en un ancho de bus de 256 bits y 348 GB/s de transferencia. En ambas consolas se está utilizando una tarjeta gráfica AMD de arquitectura RDNA 2 con 10,3 TFLOPS de rendimiento.

Funcionamiento y características

GDDR6 fue un gran paso adelante respecto a GDDR5 y GDDR5X, ya que en un solo chip es capaz de actuar como dos memorias DRAM independientes al contar con un doble canal. De esta forma el controlador de memoria trabaja de forma más eficaz al disponer de mayor cantidad de canales.

Gráfica de señal NRZ vs PAM4

Además, cada chip GDDR6 incrementa su capacidad individual, que puede ser de hasta 4 GB frente a los 2 GB que soporta GDDR5. De cara a la práctica, las tarjetas gráficas mainstream utilizan chips de 1 GB y 32 bits por canal para aumentar el ancho de banda y la trasferencia de la tarjeta. De esta forma una capacidad de 11 GB es capaz de darnos 352 bits de ancho de bus a 616 GB/s de ancho de banda, con 8 GB alcanzaríamos los 256 bits a 448 GB/s y así sucesivamente hasta llegar a las GPU de 4 GB de capacidad.

Las memorias GDDR6 supusieron otro importante cambio respecto a las DDR5 en el modo de operación. Mientras que DDR5 se basa en el funcionamiento de las DDR3, GDDR6 es capaz de duplicar la transferencia de datos por cada ciclo de reloj de 2 a 4. Este es el motivo por el cual ahora la transferencia efectiva es la transferencia de reloj multiplicada 8 veces: reloj *2 (DDR) * 4 (GDDR6). Así una memoria GDDR6 de 2000 MHz alcanza los 2000 * 8 = 16000 Gbps de transferencia. La capacidad máxima que se ha alcanzado con los chips GDDR6 actuales es de 21 Gbps, aunque dicha capacidad no se utiliza en las tarjetas.

Los chips GDDR6 utilizan la tecnología NRZ para codificar los datos en bits en la transferencia de información entre GPU y memoria. Este método utiliza un solo bit por cada ciclo de reloj, generando de esta forma pulsos con valores binarios de 0 y 1. Luego veremos que GDDR6X cambia completamente el paradigma a 2 bits por ciclo, pero este método aún tiene la ventaja de ser fiable en cuanto a la generación de errores lectura/escritura en la RAM.

GDDR6 supuso un antes y un después en la utilización de memoria por parte de las tarjetas gráficas, pues los gráficos de nueva generación trabajan con mucha mayor densidad de triángulos y grandes archivos por subir a una resolución 4K. Además de ancho de banda, también se requiere velocidad de copia para generar la profundidad de campo en espacio 3D y mundo abierto, todos ellos repletos de efectos y trazado de rayos en tiempo real.

Memoria GDDR6X

Nvidia RTX 3090

La primera diferencia importante acerca de la memoria GDDR6X vs GDDR6 es que no se considera aún un estándar JEDEC en el mercado. Esto quiere decir que su creador Micro tienen el monopolio de la tecnología y especificaciones que utiliza. A pesar de que guarda la misma raíz en el nombre, muchos aspectos han cambiado en esta memoria, como es la forma de codificar los datos.

La gran apuesta de Micron y Nvidia

Citar la gran cantidad de dispositivos que utilizan GDDR6 era bastante complejo, pero en este caso la incógnita se resuelve con bastante rapidez. Micron decidió crear unas memorias innovadoras y que seguramente sean el punto de partida de una nueva generación mucho más potente y de muy bajo consumo. Nvidia se fijó en ellas y se lanzó directa por la exclusividad.

Actualmente GDDR6X solamente está presenta en las tarjetas gráficas Nvidia RTX 3080 y RTX 3090, pertenecientes a la arquitectura Ampere de 8 nm de 2021. Esta nueva generación también cuenta con más modelos como la 3070, 3060 Ti y 3060 por ahora, pero en ellas se ha optado por chips GDDR6 a 14 Gbps. A la espera de lo que Nvidia saque durante 2021 como más versiones de sus tarjetas de gama media o unas próximas RTX 30 Super, solamente dos tarjetas disfrutan de esta memoria.

PAM4 y diferencias entre GDDR6X vs GDDR6

Gráfica de codificación NRZ vs PAM4

El objetivo de Micron con estos nuevos chips de memoria era alcanzar la cifra máxima de 21 Gbps a los que podían llegar las memorias GDDR6, añadiendo mejoras en la estabilidad, overclocking y manteniendo los costes y voltajes. Este objetivo está conseguido, aunque de nuevo, la transferencia en los modelos de producción está recortada a 19 Gbps que ya es mucho más que los 14 o 16 Gbps especificados en los chips GDDR6.

El rendimiento de GDDR6X es con diferencia superior y la clave está en el nuevo sistema de codificación PAM4 frente al NRZ de la generación anterior. Esta tecnología se basa ni más ni menos que en la electrónica utilizada en redes, más concretamente en la Pulse Amplitude Modulation (PAM) o modulación por amplitud de pulso en español. Esto es diferente al anterior método que solamente usaba el valor bajo y alto del pulso para generar 0 y 1.

PAM4 es capaz de codificar hasta 2 bits por cada ciclo de reloj, y para ello se sirve de una señal modulada de 4 formas diferentes. Trasladando cuatro amplitudes de onda al ámbito binario, generamos 4 símbolos binarios: 00, 01, 10 y 11 como es obvio. De esta forma, en cada ciclo de reloj se transporta el doble de información que hasta ahora siendo capaz de realizar el mismo trabajo que GDDR6 en la mitad de tiempo siempre que se use la misma frecuencia de reloj.

Comparativa señales entre memorias

En la anterior gráfica que facilita Micron en la documentación técnica, vemos una comparativa de funcionamiento entre las distintas memorias gráficas. La primera diferencia se marca claramente entre la memoria GDDR5 y GDDR6 en donde se duplican las operaciones por cada ciclo de reloj, utilizando el modo Dual Data Rate en lugar de Single Data Rate (SDR). Esto se mantiene en la GDDR6X por basar el CMD y ADDR en el mismo sistema.

Las diferencias vienen marcadas en la gráfica de datos y la de frecuencia WCK que con solo la mitad es capaz de hacer le mismo trabajo que GDDR6. El hecho de utilizar una lectura y escritura de datos sincronizada en el mismo ciclo de reloj, hace que se pueda alcanzar el 100% de uso del bus VRAM, es decir, tCCD = 2 tCK.

Gráfica de señales PAM4 vs RDQS

Las memorias GDDR6X disponen de dos modos diferentes de operación que se reflejan en el anterior diagrama. Básicamente tenemos el nuevo modo PAM4 y otro denominado RDQS que es equivalente al modo de operación de las GDDR6.

  • PAM4 será el modo de máximo rendimiento de las memorias. En él la frecuencia de reloj y el reloj de comando son las mismas. Los datos tienen una longitud de 2 UI, y 8 símbolos contienen 2 bits de datos por cada dos ciclos de reloj, lo que ya hemos mencionado antes. Esto resulta en una Burst Lengt (BL) o longitud de ráfaga de 8 elementos. Este modo de operación es ideal para juegos y operaciones a alta velocidad por encima de los 5 Gbps y transferencias efectivas de 20 Gbps.
  • En RDQS se pretende reducir el consumo de energía del controlador de memoria, colocando la frecuencia de reloj al doble de la frecuencia de reloj de comando. Ahora el UI pasa a ser de 1, trabajando con un BL de 16 bits cada dos ciclos de reloj. Este modo sería algo así como decir PAM2, utilizando una codificación igual que NRZ.

Esta tecnología parece funcionar estable y sin fisuras, siendo una gran referencia a partir de ahora en la industria. Este método, que realmente no es novedoso de cara al uso en otros sistemas como el mencionado de redes de datos, podría darnos memorias RAM mucho más rápida. Incluso en algún momento generar hasta 8 combinaciones distintas y trabajar con hasta 3 bits. Podría ser la forma de encontrar nuevos saltos de velocidad sin utilizar relojes de tan alta frecuencia, algo así como la introducción de núcleos en las CPU.

Ventajas y desventajas de GDDR6X

A la hora de su aplicación práctica, esta primera generación no está utilizando toda la capacidad de ancho de banda que podría tener. Por ahora se ha mantenido en los 21 Gbps como máximo, siendo el máximo teórico de 42 Gbps si tenemos en cuenta que duplica el rendimiento de GDDR6. ¿Por qué no utilizar su máxima capacidad?

  • Menos frecuencia de reloj: tal y como veremos luego en las pruebas, estos chips usan un reloj de solo 1219 MHz frente a los 1750 MHz de las GDDR6 para rendir bastante más, lo que hace trabajar de forma más segura y sin fallos en lectura y escritura.
  • Menos generación de calor: las altas frecuencias son el peor enemigo de la temperatura en un semiconductor, y estas GDDR6X son más frescas que las GDDR6, generando así mayor capacidad de overclocking.
  • Menos voltaje de operación: actualmente ambas memorias usan el mismo voltaje de 1,35V con un máximo de 1,8V de pico, siendo un logro por parte de GDDR6X al rendir potencialmente el doble.

La eficiencia energética es una de las ventajas más importantes de GDDR6X vs GDDR6, ya que Micron afirma necesitar un 15% menos de energía por cada bit de datos trasferido frente a una memoria GDDR6 a 14 Gbps duplicando el ancho de banda. Esto evidentemente es complicado de demostrar, si las memorias GDDR6 no parecen tener sensores para ver su consumo concreto por software.

En cuanto a desventajas, la única que podemos citar es la precisión con la que debe trabajar el controlador de voltaje de las memorias. Como vemos en las gráficas anteriores, la señal debe ser mucho más clara y certera para que el sistema PAM4 identifique y codifique la información. Su equivalente en NRZ sería completamente imposible, ya que la amplitud de onda y la densidad de ellas por cada ciclo de reloj haría imposible una lectura clara de ellas.

Precisamente por este motivo, ahora encontramos impresionantes VRM de hasta 22 fases de alimentación en las tarjetas Nvidia RTX 3090 y 3080, siendo un apartado esencial para no producir errores en las ondas de energía. No obstante, GDDR6X es una memoria más susceptible a errores de R/W sobre todo si se exprimen en overclocking manual con un VRM deficiente.

En nuestras pruebas hasta la fecha, estas memorias han ido perfectas y sin problemas de este tipo. Si bien es cierto que no están dando su máximo teórico como ya se ha mencionado durante el artículo.

Pruebas de rendimiento GDDR6X vs GDDR6

A continuación, hemos realizado algunas pruebas de rendimiento entre memorias GDDR6 a 14 y 15,5 vs GDDR6 a 19,5 Gbps para ilustrar de alguna forma las diferencias de rendimiento entre ellas.

En la primera tanda de pruebas tenemos nada menos que una Nvidia RTX 3090 con 24 GB de memoria GDDR6 a 384 bits capaz de desarrollar un ancho de banda de 936,2 GB/s con especificaciones de stock. Estamos por tanto rozando el TB/s de transferencia, algo que solamente ha sido superado por la AMD Radeon VII y su memoria HBM2 de 4096 bits. La ventaja en este caso es que su implementación y coste de fabricación es mucho menor.

Si nos fijamos en las cifras, veremos que en lectura y escritura tenemos cifras similares a una discreta DDR2. De hecho, en PCIe Gen4 se duplica el rendimiento en estas dos tareas, aunque no significa un incremento de rendimiento a la hora de mover juegos. Mientras que en PCIe 3.0 tenemos en torno a los 12.000 MB/s en lectura y escritura, en placas PCIe 4.0 duplicamos el valor a 24.000, acercándose más a lo que sería una memoria DDR3.

La cifra realmente importante en una GPU es la de copia de archivos, y nos situamos en cifras de casi 800 GB/s con un reloj de 1219 MHz, frente a unos 44 GB/s de una memoria RAM promedio trabajando a 1800 MHz de reloj. PAM4 junto a ese brutal ancho de bus brillan con luz propia en esta tarjeta. El reloj efectivo que puede verse desde HWiNFO es de 9.750 MHz, es decir 19,5 Gbps efectivos.

El último dato importante en este caso será el consumo de la memoria, que en conjunto será de prácticamente 82W en tiempo real. Considerando que tenemos 24 chips GDDR6X, podríamos calcular a groso modo un consumo de 3,42 W por unidad. El voltaje en la salida será de 1,044 V.

En esta GPU hemos llevado al máximo de prestaciones y estabilidad la memoria realizando un overcloking, elevando el reloj hasta los 1356 MHz dando un valor de transferencia de 1041 GB/s. De esta forma la transferencia en copiado se eleva hasta os 888 MB/s y el consumo hasta los 95W.

Impresionante capacidad de mejora al ascender la transferencia efectiva hasta los 21,7 Gbps, algo más de lo estipulado por Micron en los chips. Pero cabe decir que las mejoras de rendimiento de cara a juegos se experimentan con un incremento de unos 600 a 700 MHz efectivos, y superando esa cifra los FPS no sufren cambios.

En el lado contrario tenemos los datos que puede ofrecer una memoria GDDR6 a 14 Gbps, la habitual en las Nvidia RTX 20 y la gama media de RTX 30. Tomando el ejemplo de una RTX 2060 con 6 GB tenemos una transferencia en copia de 273 GB/s, siendo el 65% menos de rendimiento que una GDDR6X. Estos datos serán los mismos con independencia del tamaño, por depender del rendimiento de los chips, no del ancho de bus. No se aportan datos concretos acerca del consumo ni voltaje de la memoria.

La memoria GDDR6 mejorada a 15,5 Gbps de la 2080 Super mejora los registros hasta alcanzar los 403 GB/s, un leve incremento al exprimir el reloj hasta los 1938 MHz. Tampoco dispone de datos sobre consumo o voltaje concreto de las memorias.

Conclusiones acerca de GDDR6 vs GDDR6X

Las memorias GDDR6X han supuesto un antes y un después en las aspiraciones del fabricante Micron, y su cliente Nvidia ha implementado junto a las nuevas tarjetas de arquitectura Turing. Mucho mayor rendimiento utilizando una frecuencia inferior, todo ello al mismo voltaje y temperaturas más bajas que mejoran la capacidad de overclocking.

En la versión actual de estos chips no experimentamos problemas de estabilidad alguno, incluso superando los 21 GB/s no existe problema si el VRM es de buena calidad. No obstante, habrá que ver qué tal se comportarán estas memorias cuando muestren de lo que realmente son capaces (en teoría duplicarían esos 21 GB/s de las GDDR6).

AMD todavía no se ha pronunciado acerca de utilizar este tipo de memoria en sus tarjetas gráficas. El fabricante ha optado por llevar a los 16 Gbps efectivos sus chips GDDR6 y doblar la capacidad de esta generación hasta los 16 GB bajo un bus de 256 bits (8 chips de 2 GB a 32 bits de ancho de bus) por supuesto de la marca Samsung. Este ajustado ancho de bus se compensa con la introducción de la nueva Infinity Cache, un bloque de 128 MB que mejora la velocidad de transacciones entre GPU y GDDR6.

Os dejamos ahora con más tutoriales y guías sobre hardware:

¿Crees que la tecnología PAM será la referencia a partir de ahora en memorias de próxima generación?

Recent Posts

  • Tarjetas gráficas

RTX 5090: Detalles sobre la memoria caché L2, 36% mayor a la RTX 4090

Las tarjetas gráficas RTX 5090 y RTX 5080 de Nvidia no cuentan con aumentos sustanciales…

11 horas atrás
  • Reviews

Asus ROG Strix B860-A Gaming WiFi Review en Español (Análisis completo)

Probamos antes de su lanzamiento la versión B860-F, ahora le toca el turno a la…

12 horas atrás
  • Portátiles y ordenadores

Ryzen Z2 Go sería un 10 % más lento que el Ryzen Z1 Extreme en el Lenovo Legion Go S

Ryzen Z2 Go sería un 10 % más lento que el Ryzen Z1 Extreme. Poco…

12 horas atrás