Ya se ha lanzado la nueva NVIDIA GeForce RTX 4070 Ti, y la verdad es que ha sorprendido a muchos, especialmente por su precio. Pero… ¿será un rival para la AMD Radeon RX 7900 XT? La verdad es que la batalla es muy intensa entre ambas, pero aquí podrás comprobar los resultados obtenidos…
Índice de contenidos
Quizás también te puede interesar:
Nvidia GeForce RTX 4070 Ti y AMD Radeon RX 7900 XT: características técnicas
NVIDIA GeForce RTX 4070 Ti | AMD Radeon RX 7900 XT | |
Arquitectura | Ada Lovelace, TSMC 4nm | RDNA 3, TSMC 5nm (GCD) y 6nm (MCD) [chiplets] |
Chip | AD104 | Navi 31 |
Velocidad de la GPU | Boost de hasta 2625 Mhz | Gaming 2000 Mhz
Boost 2400 Mhz |
Núcleos gráficos | 60 Streaming Multiprocessors:
|
84 Cus:
|
VRAM y Caché | 12 GB GDDR6X
L2: 49.152 KB L1: 7680 KB |
20 GB de GDDR6
80 MB de Infinity Cache |
Velocidad de memoria | 10500 Mhz (21 Gbps) | 2500 Mhz(20 Gbps) |
Bus de memoria y ancho de banda | 192-bit (504 GB/s) | 320-bit (800 GB/s) |
Disipador | Triple ventilador | Triple ventilador |
APIs gráficas soportadas | DirectX 12 Ultimate
Vulkan 1.2, RT API OpenGL 4.6 |
DirectX 12 Ultimate
Vulkan 1.3, RT API OpenGL 4.6 |
Interfaz | PCIe Gen 4 x16 | PCIe Gen 4 x16 |
Puertos | 1x HDMI 2.1
3x DisplayPort 1.4a |
1x HDMI 2.1
2x DisplayPort 2.1 1x USB Type C |
Tamaño | 300x123x58 mm (3 slots) | 276x135x50 mm (2.5 slots) |
TGP (Total GPU Power)/TBP (Total Board Power) | 285W de TGP | 315W de TBP |
Arquitectura de la RTX 4070 Ti
Nvidia RTX 4070 Ti llega con una GPU fabricada en 4 nm TSMC customizado por Nvidia, cuya arquitectura se denomina Ada Lovelace, como ya sabes. La unidad de procesamiento posee concretamente 35.800 millones de transistores en un área de 295 mm2, prácticamente duplicando la densidad por área respecto a la anterior arquitectura Ampere.
Este modelo de tarjeta gráfica vendrá con un chip de GPU denominado AD104, con 60 Streaming Multiprocessors, es decir, menos unidades funcionales que las hermanas mayores, como la 4080 y 4090. Estas unidades SM se dividen cada una en:
- 1 núcleo de RT (Ray Tracing)
- 4 núcleos Tensor
- 128 núcleos CUDA (Compute Unified Device Architecture).
Es decir, en total contamos con una arquitectura de GPU en la que hay:
- Esta unidad de GPU cuenta con un bloque de caché L2 unificado de 49.152 KB compartida por los núcleos, es decir, bastante más que en Ampere. Y bloques de 128 KB por cada SM, haciendo un total de 7.680 KB.
- Suman un total de 7680 CUDA Core, las unidades de sombreado tradicionales que duplicando una vez más su rendimiento. Es capaz de alcanzar un rendimiento de 40,09 TFLOPS en FP16 y FP32, y 626,4 GFLOPS en FP64.
- Los Tensor Core de 4ª generación suman un total de 240 unidades, misma cantidad que unidades de textura o TMUs, cuya función es la de procesamiento matricial y acumular operaciones matemáticas para Inteligencia Artificial. Con DLSS 3 admite un nuevo formato FP8 que duplica su capacidad ocupando menos espacio que FP16.
- Finalmente los 60 núcleos RT de 3ª generación se encargan de procesar los rayos de luz que inciden sobre los objetos. En Ada Lovelace se introduce un Motor de micromapa de opacidad duplicando el rendimiento al generar micromallas para aumentar la densidad de geometría. Las unidades de rasterizado o ROPs suman un total de 80 en la configuración de TPC (Texture Processing Clusters).
Al igual que los otros modelos lanzados previamente, la Nvidia RTX 4070 Ti cuenta con encoders AV1 NVENC duales de 8ª generación, siendo una gran ventaja para streamers, grabación de gameplay y renderizado de vídeo en 4K. De hecho, esta nueva generación de motores de codificación es hasta un 40% más eficientes que Ampere, pudiendo funcionar en paralelo dividiendo el trabajo y ofreciendo mejor calidad en resoluciones 4K que con codecs como losH.264 y H.265.
En cuanto a la memoria VRAM, tenemos un total de capacidad de 12 GB GDDR6X (recuerda que ésta era la famosa RTX 4080 de 12 GB renombrada que nunca llegó a salir) a una frecuencia de reloj de 10500 MHz o 21 Gbps efectivos. El bus de memoria tiene un ancho de palabra de 192 bits, la misma configuración a priori que las 3060 y tarjeta Nvidia de gama media, pero alcanzando un ancho de banda de 504 GB/s y 626 Gigatexels/s de Texture Rate. Y es que se siguen utilizando chips Micron con tecnología de operación PAM4 que le permiten trabajar con 2 bits por cada ciclo de reloj en lugar de las GDDR6 estándar que vemos en las AMD Radeon o en las propias NVIDIA GeForce RTX 40 Series para portátiles.
Novedades en la arquitectura RDNA 3
La nueva GPU AMD Radeon RX 7900 XT implementa por primera vez la tecnología de chiplets llevada a cabo en los procesadores de escritorio. Concretamente tenemos dos tipos de chips interconectados mediante un interposer capaz de llegar a velocidades de bus de 5,3 TB/s. Estos chips que componen el chiplet llegan a un total de 57,7 miles de millones de transistores mezclando a su vez dos procesos de fabricación en litografías diferentes. Y el TBP (Total Board Power) especificado es de 315W, 20W inferior al modelo RDNA 2 tope de gama, prácticamente duplicando su rendimiento.
El más grande de los chips integrados en este empaquetado de GPU es el conocido como GCD (Graphics Compute Die) con un tamaño de 300 mm2 . Éste usa el proceso de fabricación de 5 nm de TSMC. Será el motor de la GPU encargado de la computación principal con sus respectivas unidades de procesamiento gráficas. En su interior tenemos un total de 84 Unidades de computación para esta 7900 XT:
- Que a su vez suman 84 unidades de Aceleración de Trazado de Rayos de 2ª generación. Se beneficia de las mejoras en el bloque de memoria y amplían la cantidad de líneas de datos para incrementar hasta 1,8x veces el rendimiento respecto a RDNA 2.
- AMD también ha implementado núcleos IA, más concretamente 2 por cada GCD sumando un total de 168 en la 7900 XT. Estas unidades se encargan de procesar instrucciones provenientes de AMD FidelityFX Ray Tracing y Radeon Super Resolution para potenciar su rendimiento y mejorar la calidad de imagen en juegos.
- Y también tenemos 5376 unidades de sombreado o Stream Processors, 64 por cada unidad de computación que se encargan del renderizado y sombreado de la imagen como viene siendo habitual.
AMD está alcanzando a NVIDIA con sus últimas series 6000 y 7000 de GPUs, es decir, las basadas en RDNA 2 y RDNA 3. Sin embargo, aún le falta un pasito más para lograr llegar al rendimiento de la tope gama de NVIDIA. Pese a eso, lo cierto es que el rendimiento de estas gráficas es realmente impresionante. Estamos prácticamente duplicando el rendimiento en las unidades de procesamiento internas, entregando impresionantes cifras como los 52 TFLOPS en FP32 (23,65 TFLOPS la RX 6950 XT) o 103 TFLOPS en FP16 (47,31 TFLOPS en RX 6950 XT). Y es esta tarjeta cuenta con nada menos que 192 ROPs y 336 TMUs superando a la Nvidia RTX 4080 (112 y 304 respectivamente).
También se ha dado un paso al frente en el ámbito de creación de contenido implementando un sistema de doble codificador AV1 igual que han hecho las tarjetas de Nvidia. Estas unidades son capaces trabajar con resolución 8K @ 60 FPS, y dado que son dos, permiten hacer el proceso de codificar o decodificar de forma simultánea. Cuenta con tecnología IA para la mejora de calidad en la captura de vídeo, mejorando sustancialmente a los formatos H.264 y H.265 también soportados por la tarjeta gráfica. En este sentido, muy igualada con la de NVIDIA.
Pasamos a la configuración de memoria de la AMD Radeon RX 7900 XT donde está una gran parte de la mejora de rendimiento de la arquitectura. Comenzados con la caché L0, la más cercana a los núcleos donde tenemos bloques de 64KB por cada unidad de computación (hasta un 240% de aumento), por encima tenemos bloques de 256 KB de caché L1 por cada complejo de procesamiento de la GPU (hasta el 300% de aumento), y como tercer bloque L2 interno tenemos 6 MB compartidos en todo el GCD (50% de aumento).
Y bien, toda esa memoria ha sido posible debido a la otra unidad o chip que componen el chiplet, que es el denominado MCD (Memory Cache Die) basados en un proceso de fabricación de 6 nm. Contienen los 80 MB de memoria Infinity Cache de 2ª Generación de la tarjeta gráfica. Estos bloques de caché han incrementado su eficiencia y velocidad de comunicación con el bloque de caché L2 alcanzando los 2912 GB/s de ancho de banda, y además han aumentado masivamente el ancho de bus de 320-bits, es decir, aunque vaya más lento que la NVIDIA, el ancho es mayor, por lo que puede transportar más bits a la vez.
La configuración de memoria VRAM o memoria gráfica principal, tiene una capacidad de 20 GB en este modelo, 4 GB menos que su hermana mayor la XTX. Para ello se utilizan 10 chips GDDR6 generando un bus de 320-bit, trabajando a una frecuencia de reloj de 2500 MHz, lo que genera 20 Gbps de transferencia efectiva y 810 GB/s de ancho de banda total. Es prácticamente la máxima frecuencia que se puede alcanzar con esta arquitectura GDDR6, casi a la par de los chips GDDR6X en cifras de ancho de banda. Con todo esto, la tarjeta genera un pixel rate de 460 GP/s en comparación con los 295,7 GP/s de la 6950 XT, siendo otro salto abismal. Evidentemente se asegura compatibilidad con la tecnología Smart Access Memory (Resizable BAR) tanto en CPU AMD como Intel.
Y no olvidemos que frente a NVIDIA DLSS, AMD también cuenta con su propia tecnología denominada FidelityFX Super Resolution. Y no solo eso, también podrás disfrutar de otras tecnologías implementadas por software como Radeon Boost, Radeon Chill, Radeon Image Shaperning o Radeon Anti LAG.
RTX 4070 Ti vs 7900 XT: Banco de pruebas y test de rendimiento
Llegó el momento que más esperabas, el de comparar el rendimiento de la NVIDIA GeForce RTX 4070 Ti y la AMD Radeon RX 7900 XT para ver cuál gana. Para ello se ha usado un banco de pruebas que es el siguiente:
BANCO DE PRUEBAS |
|
Procesador: | Intel Core i9-12900K |
Placa Base: | Asus ROG Strix Z790 Hero |
Memoria RAM: | 32 GB Kingston Fury Beast DDR5 5600MHz |
Disipador | Corsair H150i Elite LCD |
Disco Duro | Samsung 860 QVO |
Tarjeta Gráfica | Nvidia RTX 4070 Ti |
PSU | Corsair RM1000 |
Monitor | Viewsonic VX3211 4K mhd |
*Hemos ejecutado las pruebas sobre Windows 11 Pro 22H2 (22621.819) con los drivers Nvidia en su versión 527.62.
La jugabilidad de una tarjeta gráfica se ha valorado en función del framerate obtenido de esta forma:
Escalones de rendimiento | |
Frames Por Segundo (FPS) | Jugabilidad |
Menos de 30 FPS | Injugable |
30 ~ 40 FPS | Jugable |
40 ~ 60 FPS | Buena |
Mayor de 60 FPS | Fluido / Consola |
Mayor de 144 FPS | Realista |
Benchmarks
Para las pruebas de benchmark hemos empleado los siguientes programas para obtener los resultados en esta batalla RTX 4070 Ti vs RX 7900 XT:
- 3DMark Fire Strike Extreme (DX11) y 3DMark Time Spy Extreme (DX12)
- Port Royal (RT)
- Pure Raytracing (1440p) medido en FPS
Pruebas en juegos
Continuamos con el análisis de la Nvidia GeForce RTX 4070 Ti vs AMD Radeon RX 7900 XT, pero en este caso hemos empleado títulos de algunos de los videojuegos AAA más conocidos para ver el rendimiento real medido en FPS (Frames Per Second):
- Shadow of Tom Raider
- Far Cry 5
- DOOM Eternal
Para los juegos a 1080p:
Para los juegos 1440p:
Y para 4K tenemos estos otros resultados:
Recuerda que mientras mayor es la resolución, menos depende de la CPU y más de la GPU.
Pruebas de renderizado
Además de lo anterior, también se ha probado en otro tipo de software para ver sus capacidades en otros campos, como el renderizado o la codificación, para los creativos. En este caso, los resultados de las pruebas NVIDIA GeForce RTX 4070 Ti vs AMD Radeon RX 7900 XT son:
- Blender 2.9 + proyecto The Junk Shop (menos tiempo es mejor, ya que se mide en segundos):
- Grabación en 4K Doom Eternal con enconder AV1 en OBS 29.0.0 Beta 2:
- RTX 4070 Ti: en este caso, la NVIDIA RTX 4070 Ti ha obtenido un sólido resultado. En la prueba de grabación de gameplay en 4K con el codec dual AV1 la imagen se muestra mejor que con el codec H.264 en OBS, utilizando un bitrate de 6000 Kbps y mismas opciones de calidad. No existe pixelación ni tirones, manteniéndose en alto framerate durante el juego para darnos una experiencia óptima.
- 7900 XT: hubo que ajustar los parámetros a equilibrado porque sufría algunos tirones en el modo Calidad. Esto puede deberse a que aún estamos en una fase beta del programa de captura. Veremos si más adelante el rendimiento mejora, no obstante, la calidad de imagen sigue siendo muy buena.
Temperaturas y consumo
Y para finalizar, hay que hacer pruebas también en el aspecto del consumo y la temperatora, dos aspectos clave debido a los altos consumos y disipación de energía calorífica de estas tarjetas gráficas de última generación. En este caso, las pruebas han dado estos datos de temperatura (medidos en ºC):
Mientras que las pruebas de consumo (medida en vatios o W) son:
También te recomiendo leer nuestra guía sobre las mejores tarjetas gráficas del mercado.
Conclusión
Como podemos ver, la cosa está muy igualada entre la NVIDIA GeForce RTX 4070 Ti y la AMD Radeon RX 7900 XT, sin embargo, a resoluciones mayores vemos que la de AMD tiene una ligera ventaja. En cuanto a Ray Tracing, la NVIDIA sigue estando un pasito por delante, por supuesto.
En cuanto al precio, vemos que la RTX 4070 Ti tendrá un precio en el mercado europeo de unos 900€, aunque puede variar según el fabricante de la PCB. En el caso de la Radeon RX 7900 XT tiene un precio recomendado a partir de los 899€, y puede variar según el fabricante de la tarjeta como en el caso de NVIDIA. Por tanto, se puede decir que ambas están muy igualadas… Así que la ganadora en este caso sería la RTX 4070 Ti a no ser que quieras jugar con las máximas resoluciones y no te importe tanto el Ray Tracing, en cuyo caso la 7900 XT ha dado mejores resultados.