La Radeon RX 7900 XTX ya es una realidad y lo más interesante es haceros una comparativa: AMD RX 7900 XTX vs NVIDIA RTX 4080. Con los rumores y los datos que se han ido conociendo hasta el momento sobre esta tarjeta gráfica, muchos apuntaban a que estaría igualada con la NVIDIA GeForce RTX 4080, pero con un precio más bajo, lo que compensaría a muchos gamers a decantarse por esta gráfica.
Pues bien, después de la review de la RTX 4080 y de la la review de la RX 7900 XT, aquí vamos a analizar las pruebas de rendimiento realizada sobre la RTX 4080 vs la RTX 7900XTX. Que de momento no la tenemos en nuestro banco de pruebas, pero para ello hemos cogido resultados externos para comparar los resultados y sacar nuestras propias conclusiones…
Índice de contenidos
Características técnicas de la Radeon RX 7900 XTX vs GeForce RTX 4080
Radeon RX 7900 XTX | GeForce RTX 4080 | |
---|---|---|
Arquitectura | RDNA3 (TSMC N5) (6nm para los MCD) | Ada Lovelace (TSMC 4N) |
GPU | Navi 31 XTX | AD103-300 |
GPU Clusters | 96 CUs | 76 SMs |
FP32 Cores | 12288/6144SP | 9728 |
Frecuencia de reloj base | 1.9 GHz | 2.2 GHz |
Game Clock | 2.3 GHz | |
Boost Clock | 2.5 GHz | 2.5 GHz |
Memoria VRAM | 24GB GDDR6 | 16GB GDDR6X |
Bus de memoria | 384-bit | 256-bit |
Velocidad de la memoria | 20 Gbps | 22.4 Gbps |
Memoria caché | 96 MB (Infinity Cache) | 64 MB |
Ancho de banda | 960 GB/s | 717 GB/s |
TDP | 355W | 320W |
Conector de alimentación | 2 × 8-pin | 1 × 16-pin |
Interfaz | PCIe Gen4 x16 | PCIe Gen4 x16 |
MSRP | $999 | $1,199 |
Fecha de lanzamiento | 13 de diciembre, 2022 | 16 de noviembre, 2022 |
Sobre la arquitectura de la Radeon RX 7900 XTX
Como sabes, AMD ha presentado su arquitectura RDNA 3, la nueva arma de la firma para competir con la Ada Lovelace de su enemigo número 1. Tanto una como otra han conseguido estar muy por delante del tercero en discordia: Intel.
Como vemos, se han usado unos 58.000 millones de transistores para estas nuevas GPUs de AMD, aunque es cierto que no todos están en un chip monolítico como en el caso de NVIDIA, sino que se han repartido en varios chips (chiplets). A pesar de estar separada, lo que hace que crezca algo la latencia entre la comunicación de los chips y el consumo para la transmisión de datos, lo cierto es que AMD ha mantenido un rendimiento bastante bueno y también ha controlado el consumo muy por debajo de los consumos de la RTX 4090.
Como sabes, la nueva arquitectura chiplet de la RDNA 3 tiene un chiplet de GPU (GCD o Graphics Compute Die) y otro de memoria denominado MCD (Memory Computer Die). Concretamente, en esta Radeon RX 7900 XTX tope gama hay 6 unidades MCD rodeando al GCD. En el caso de los MCD son chips sustancialmente más pequeños, ya que miden unos 37 mm2, mientras que el GCD es muy superior en cuanto a dimensiones.
En la Radeon RX 7900 XT también aparecen seis unidades MCD, pero no funcionan todas, solo cinco de ellas están activas. Esa es la diferencia con la XTX más sustancial. Eso significa que la Radeon RX 7900 XTX tiene 96 MB de Infinity Cache y la RX 7900 XT tiene solo 80 MB.
La GPU Navi 31 que está presente en esta tarjeta gráfica está fabricada en 5nm, un nanómetro menos que los MCD. Además, este chip cuenta con hasta 12288 Streaming Processors y 96 MB de Infinity Cache, como he dicho anteriormente. El bus de memoria que conecta la VRAM con la GPU tiene un ancho de 384-bit, lo que le da una capacidad de hasta 20 Gbps de velocidad para sus 24 GB de GDDR6 (ya sabes que la GDDR6X es una tecnología desarrollada conjuntamente por Micron y NVIDIA y no la montan las AMD).
También se puede apreciar que AMD ofrece varias frecuencias de reloj para la Radeon RX 7900 XTX para reducir el consumo de forma considerable. Por un lado tenemos una frecuencia de 2.3 Ghz para los shaders o unidades de sombreado y por otro tenemos una frecuencia de reloj de 2.5 Ghz para el front-end de la GPU. Esa división de relojes hace que el consumo esté muy por debajo de lo que vemos en el lado de NVIDIA con la 4090. Concretamente, AMD ha dicho que se ha aumentado la frecuencia de reloj en un 15% respecto a la RDNA2 y se ha bajado el consumo en un 25%.
La compañía lanzará una serie de alta gama con GPU Navi 31 y a la que seguirán después sus hermanas pequeñas Navi 32 y Navi 33 para completar así la nueva serie 7000 de AMD.
Me gustaría comentar también que en esta generación AMD utilizará unidades de procesamiento WGP (Work Group Processors) en lugar de sus Compute Units (CU). Cada WGP tendrá dos CUs, pero cada CU tendrá cuatro clusters SIMD32 en lugar de solo dos en cada CU como en la RDNA 2. Esto ha permitido el salto de rendimiento tan grande que ha habido con respecto a las 6000 Series. Por otro lado, también hay unidades IA mejoradas, similares a los núcleos Tensor de la NVIDIA.
Al tener un GCD basado en unidades SIMD duales, duplica el número de unidades de sombreado. Concretamente, la Radeon RX 7900 XTX incluye 96 CUs, cada una con 64 procesadores de doble emisión. Eso hace que se puedan procesar dos instrucciones por cada ruta de datos, lo que da como resultado el doble de velocidad de emisión de instrucciones que en la RDNA 2. Eso no quiere decir que sea el doble de rápida, pero sí que permite procesar las instrucciones más rápidamente.
Cada CU también incluye aceleradores de IA para operaciones como la multiplicación de matrices, acelerar el Ray Tracing o trazado de rayos. Este nuevo acelerador de RT de AMD de segunda generación admite instrucciones adicionales y ordenación de cuadros de rayos, lo que se traduce en una mejora del rendimiento de hasta el 50% por cada CU. Sin embargo, no llega al nivel de la NVIDIA.
Por último, cada CU incluye un registro vectorial de propósito general (VGPR), que es esencialmente donde se almacenan las instrucciones de la CU mientras esperan para ser procesadas.
En total tendrás hasta 12.288 procesadores de sombreado para la GPU Radeon RX 7900 XTX, también llamados procesadores de flujo (Streaming Processors). En comparación con los 5.120 SP de la GPU Navi 21, esto supone 2,4 veces más núcleos de procesamiento. La GPU Navi 31 también contará con 6 MCD, cada uno de los cuales tendrá 16 MB de Infinity Cache y controladores de memoria de 64 bits (32 bits x2), lo que dotará al chip de una interfaz de bus de 384 bits. Los chips de memoria también incluyen el controlador de memoria integrado.
Los núcleos de raytracing de nueva generación deberían compensar el rendimiento que le faltaba a la 6000 Series en Raytracing. Por CU, AMD afirma un 50% más de rendimiento. Pero como veremos, aún está un pasito por detrás de NVIDIA…
También se actualiza el motor de vídeo o multimedia, que soportará la codificación y descodificación simultáneas AVC/HEVC, la codificación y descodificación ABV1 8K @ 60 FPS y la codificación de vídeo mejorada AI. Y para su interfaz de conexión de pantallas, se admite Displayport 2.1 con un ancho de banda de enlace de pantalla de hasta 54 Gbps.
Sobre la arquitectura de la GeForce RTX 4080
Una vez hemos visto las novedades de la RDNA 3, ahora vamos a hacer lo mismo con la nueva Ada Lovelace que da vida a la RTX 4080 de NVIDIA. Esta GeForce es el segundo modelo lanzado basado en esta arquitectura, junto con su hermana mayor la RTX 4090. El chip cuenta con 45.900 millones de transistores en un área de 379 mm2, algunos menos que la Radeon RX 7900 XTX, pero integrados todos en un mismo chip monolítico. Además, está fabricada en un proceso de 4nm de TSMC, misma foundry pero un nodo más avanzado que el de AMD.
El chip usado para la RTX 4080 es el designado como AD103, el cual cuenta con 76 Streaming Multiprocesors, con 1 núcleo RT (Ray Tracing), 4 núcleos Tensor y 128 núcleos CUDA (Compute Unified Device Architecture) cada uno. En este caso, al no ser una tope gama, no cuenta con el máximo de núcleos posibles para Ada Lovelace, sino menos.
Por otro lado, tenemos una frecuencia de reloj más elevada que en generaciones anteriores, y un boost de hasta 2505 Mhz. Algo que no ha disparado demasiado el consumo, ya que el TDP de esta tarjeta gráfica se mantiene en los 320W.
Por otro lado, este chip cuenta con una memoria caché L2 unificada de 65 MB, y bloques de 128 KB por cada SM, con un total de 9278 KB.
Los SMT están a su vez dentro de una unidad hardware de alto nivel denominada GPC (Graphics Processing Clusters), con un total de 7. Cada unidad tiene un motor de rasterizado dedicado, con 6 TPC (Texture Processing Clusters) en cuyo interior tenemos 2 SM y el respectivo núcleo RT. Sin embargo el último GPC solo tiene 4 TCP. La tarjeta genera un total de 304 TMUs y 112 ROPs.
La suma total de núcleos CUDA será de 9728, lo que ayudará a esta GPU a alcanzar un rendimiento de cálculo en coma flotante de 48,74 Shader-TFLOPS en FP16 y en FP32. Esta mejora procede en parte de la tecnología Shader Execution Reordering (SER) capaz de reprogramar el trabajo y colas de instrucciones sobre la marcha, duplicando su efectividad respecto a Ampere (RTX 3000 Series).
Los Tensor Core de 4ª generación están presentes en una cantidad igual a 304 unidades, cuya función es la de procesamiento matricial, multiplicar y acumular operaciones matemáticas para IA y HPC. Trabajando con las redes neuronales utilizadas en DLSS, admitiendo un nuevo formato FP8 que se introdujo en la arquitectura Nvidia Hopper que reduce a la mitad los requisitos de almacenamiento de datos respecto a FP16, por lo que duplica la capacidad IA.
Los 76 núcleos RT de 3ª generación se encargan de procesar el Ray Tracing para generar los rayos de luz que inciden sobre los objetos. En Ada Lovelace duplican el rendimiento respecto a la 2ª generación de Ampere introduce un Motor de micromapa de opacidad duplicando el rendimiento al generar micromallas sobre la marcha para aumentar la densidad de geometría y darnos un mayor realismo.
En cuanto a la memoria VRAM, aumenta de tamaño respecto a la 3080 con 10 GB a 16 GB GDDR6X a una frecuencia de reloj exprimida hasta los 1400 MHz o 22,4 Gbps efectivos. Todo esto combinado con su bus de 256-bit, puede alcanzar un ancho de banda total de 716,8 GB/s como he indicado en la tabla anterior. Estas memorias siguen utilizando chips Micron con tecnología de operación PAM4 que le permiten trabajar con 2 bits por cada ciclo de reloj.
Comparativa Radeon RX 7900 XTX vs GeForce RTX 4080
Ahora bien, en cuanto a lo que estabas esperando, la comparativa del rendimiento de una GPU y otra, lo cierto es que los resultados de las pruebas de rendimiento te van a sorprender, ya que no en todas se le da la razón a los rumores y demás información que pululaba por la red antes del lanzamiento. En la batalla vemos a dos titanes muy igualados, y los resultados entre la Radeon RX 7900 XTX vs GeForce RTX 4080 son:
Benchmarks
En cuanto a las pruebas sintéticas realizadas, se pueden ver los siguientes resultados para Unigine: Superposition (API: DirectX 11):
En el caso de DX11: 3DMark FireStrike (Ultra) los resultados son:
Y para finalizar, con DX12: 3DMark Time Spy se han obtenido estos otros datos:
Videojuegos
Para ver cómo rinde la Radeon RX 7900 XTX y la GeForce RTX 4080 en el terreno práctico, también hemos comparado ambas en diferentes videojuegos. Los videojuegos elegidos han sido los siguientes:
- Shadow Of The Tomb Raider (API: DirectX 12)
- Far Cry 6 (API: DirectX 12)
- Assassins Creed: Valhalla (API: DirectX 12)
Cada uno probado en tres resoluciones, y todas ellas medidas en FPS, por lo que más es mejor.
Empezando por la 1080p, los resultados son:
Luego también se ha probado en 1440p, con estos resultados:
Y, finalmente, los resultados para UHD son:
Ray Tracing
En cuanto al Ray Tracing, probado en el videojuego F1 2022 y Cyberpunk 2077, los resultados medidos en FPS son los siguientes para una resolución 1080p:
Para una resolución 1440p, los resultados son los siguientes:
Y para UHD, tenemos estos otros:
Temperatura y consumo
Por último, cuando comparamos la temperatura en ºC que generan la Radeon RX 7900 XTX y la GeForce RTX 4080, podemos ver los siguientes resultados:
En el caso del consumo en vatios (W), los resultados son los siguientes:
Conclusión
Finalmente, comentar que la Radeon RX 7900 XTX ha dejado una mejor sensación que la XT. Tiene en torno a un 10-15% más de rendimiento, que es una diferencia bastante decente. Además, se posiciona junto con la RTX 4080 en cuanto a rendimiento, pero con un precio que es unos 100$ más bajo, lo que no está nada mal para un presupuesto más modesto en el caso de no poder alcanzar los precios de las RTX 4090.
Si nos fijamos en el rendimiento bruto, es bastante rápida, incluso superando en algunos puntos a la GeForce RTX 4080 (en algunos títulos de videojuegos incluso por encima de la RTX 4090), lo que la transforma en una genial alternativa. Sin embargo, tiene algunos puntos débiles, como su rendimiento en altas resoluciones, donde la Infinity Cache no ayuda tanto como se esperaba. Por eso, vemos que la GPU de AMD rinde extremadamente bien en resoluciones de hasta 2560×1440 px, pero que en UHD comienza a flaquear un poco con la RTX 4080.
Por otro lado tenemos el Ray Tracing, que es otro punto en el que AMD estaba por detrás de NVIDIA, ya que comenzó a implementarlo más tarde y parece que no ha llegado al nivel de rendimiento de la GeForce RTX. Es cierto que el rendimiento RT en la XTX es bastante bueno, y mucho mejor que la XT, pero aún está un poco atrasada con respecto a la RTX.
La combinación de estos dos puntos débiles hacen que el rendimiento en UHD (4K) baje las tasas de renderizado en algunas situaciones, perdiendo FPS frente a su competidora más directa. Y, ni que decir tiene, que queda por detrás con la RTX 4090, el buque insignia de NVIDIA con la que se debería comparar, ya que la Radeon RX 7900 XTX es la más potente de AMD.
También te recomendamos leer nuestra guía sobre las mejores tarjetas gráficas del mercado…
Sin embargo, si no vas a usar videojuegos con resoluciones UHD, hay que decir que la Radeon RX 7900 XTX es una magnífica tarjeta gráfica y que es más barata que la NVIDIA, por lo que podrías dedicar esos 100 dólares extra para mejorar otro componente, como puede ser más memoria RAM o una mejor CPU… ¿Con cuál te quedas? ¿7900XTX o RTX 4080?