El final de 2022 está siendo trepidante en lo que al mercado de PC se refiere, CPU nuevas en AMD e Intel con la batalla por todo lo alto, y ahora Nvidia hace su movimiento presentando su buque insignia nada menos que la Nvidia RTX 4090 estrenando la arquitectura Ada Lovelace de 4 nm.
Enorme en todos los sentidos, es el modelo de referencia más bestia que hemos visto con 60 mm de grosor y un impresionante disipador de aluminio unibody que mantiene la estética de Ampere. No es para menos con una PCB de 23 fases para alimentar el chipset AD102 de 450W, 128 SM y 24 GB de VRAM GDDR6X superando los 2,5 GHz de reloj. ¿Cuánto más potente es respecto a la 3090 Ti? ¿tanto como dicen los benchmarks previos? ¡lo veremos a continuación!
Agradecemos a Nvidia su confianza en nosotros por enviarnos esta tarjeta para su análisis.
Nvidia nos presenta su tarjeta gráfica tope de gama Nvidia RTX 4090 en una cuanto menos trabajada en calidad, originalidad y de amplias dimensiones. Construida sobre una cubierta de cartón duro, tenemos un sistema de apertura con bisagra horizontal que nos deja la tarjeta en una posición tipo expositor mucho más inclinada que en la anterior generación.
Sa asegura su protección al colocar múltiples capas de cartón rígido bajo la cubierta superior, y añadir sujeciones para el producto. Cuidado de todas formas con no abrir la caja correctamente, ya que la tarjeta podría caerse al suelo. En este caso no se utiliza bolsa de plástico aislante para ella.
El contenido de la caja será el siguiente:
El diseño del disipador en los modelos de referencia de la anterior generación gustó mucho a nivel estético más allá de lo que pudiera rendir térmicamente, así que la Nvidia RTX 4090 ha mantenido esta dinámica, pero aumentando bastante su tamaño. De hecho se trata del modelo Nvidia más grande junto con la RTX 3090 Ti con unas medidas de 336 mm de largo, 140 mm de ancho y 60 mm de grosor, ocupando 3 slots de la placa base.
Después de todo tiene sentido adoptar prácticamente el mismo disipador que el buque insignia de la anterior generación, ya que ambos tienen 450W de TGP especificado. Sin embargo hay ligeras modificaciones que podemos señalar como es el diseño de sus esquinas curvado ligeramente hacia dentro para refinar las líneas del conjunto. Seguimos contando con una zona de iluminación LED blanca en logotipo “GEFORCE RTX” y en el triángulo que da paso al ventilador superior.
Nos posicionamos en la cara inferior de la Nvidia RTX 4090 para ver un amplio ventilador axial en modo push de 115 mm de diámetro aprovechando mejor la zona de disipador que queda justo sobre la PCB y el chipset. Este se encarga de meter aire hacia dentro, estando contenido sobre un chasis unibody con diseño “reloj de arena” con gruesas placas de aluminio que se entrecruzan por el disipador completamente visible. No se aprecia tornillo alguno al estar bajo tapas cuidadosamente colocadas, siendo bastante complicado desmontarlo.
Bajo el ventilador tenemos un bloque de aluminio con aletas colocadas longitudinalmente que dirigen el aire hacia la salida de aire por la zona trasera. Un segundo bloque ubicado en el centro tiene aletas diagonales que se combinan con el último bloque colocado en la segunda zona del reloj de arena.
Se adopta el concepto de flujo axial al permanecer esta zona abierta por debajo, para que el ventilador superior en modo pull haga pasar el aire y refrigerar toda esta zona con la mayor efectividad posible. Si ahondamos un poco más, se puede ver el bloque de enfriamiento interno construido en cobre, que reparte el calor por todo el volumen disponible a través de 6 tubos de calor.
Pasamos a la parte superior donde tenemos toda la zona tapada con cubiertas de plástico excepto el ventilador. Estos elementos actúan como backplate aunque posiblemente se reduzca un poco la efectividad del disipador, aprovechándose la zona para serigrafiar el modelo de tarjeta en cuestión. Finalmente en el borde frontal tenemos una pequeña tapa que esconde el sistema de anclaje para soporte de tarjeta externo provisto de dos agujeros.
El sistema de 2 ventiladores estará gestionado de forma automática por la GPU, con modo cero rpm cuando esté en baja carga y por debajo de cierto umbral de temperatura. Obviamente podrán controlarse individualmente desde algún software como Afterburner o similar en caso de hacer overclocking.
El panel de puertos de la Nvidia RTX 4090 es otro elemento que sigue invariante respecto a la anterior generación al tener un total de 4 puertos repartidos en:
Sobre ellos se sitúa una enorme abertura extendida hacia el propio borde izquierdo por donde se evacua el aire. Recordamos una vez más que el puerto HDMI 2.1 soporta resoluciones máximas de 8K @120 FPS y 60 FPS comprimido y hasta 4K @144 Hz sin comprimir, contando con mayor ancho de banda que la versión operativa de DisplayPort.
Lo más relevante viene de cara a su interfaz de conexión y alimentación, pues en primer lugar, esta tarjeta no cuenta con conexión SLI o NVLink, por lo que finalmente se abandona la capacidad de operar con GPU en paralelo, pues en realidad tiene poca aplicación práctica hoy en día. Se seguirá utilizando para esta generación interfaz PCIe 4.0 o Gen4 con 16 carriles activos, siendo más que suficiente para la capacidad de los monitores actuales y la tecnología Resizable Bar, dejando Gen5 para próximas generaciones.
En cuanto al sistema de alimentación, solamente tenemos una cabecera PCIe unificada de 16 pines de última generación, siendo el camino a seguir por Nvidia para minimizar la cantidad de cabeceras en la PCB y cableado en la PSU. Al ser una interfaz muy reciente, se incluye un dongle conversor de 16 pines a 4 cabeceras PCI de 8 pines. De ellas, solamente estamos obligados a utilizar 3, pues la 4ª será necesaria sólo si pensamos overclockear la tarjeta gráfica. La conexión de 16 pines está pensada para soportar los 450W de TGP que especifica la tarjeta, esperamos que las fuentes de alimentación estén a la altura con buenos conectores y cables gruesos.
Nvidia estrena su nueva arquitectura Ada Lovelace, la cual está basada en un proceso de fabricación de 4 nm por TSMC customizado por Nvidia. Menor litografía significa más transistores por unidad de área, y esta Nvidia RTX 4090 tiene un chipset de 608,5 mm2 con nada menos que 76,3 miles de millones de transistores frente a los 28,3 miles de millones de la RTX 3090 Ti, siendo más del doble. Esto permite mejorar el IPC y eficiencia energética, de hecho el consumo de esta unidad será de 450W, el mismo especificado para la 3090 Ti. El modelo de referencia cuenta con 22 fases de alimentación.
Las GPU de la marca verde siguen teniendo como unidad de procesamiento integrada los Streaming Multiprocessors, los cuales a su vez se dividen en 1 núcleo de RT (Ray Tracing), 4 núcleos Tensor y 128 núcleos CUDA (Compute Unified Device Architecture). En conjunto ofrecen una frecuencia de reloj boost de 2520 MHz en la versión 4090 de referencia frente a los 1860 MHz que alcanza la 3080 Ti. No solo AMD, sino también Nvidia se une al club de los 2,5 GHz y subiendo ¿veremos RTX 4060 con más de 3 GHz? La tarjeta genera un total de 512 TMUs y 176 ROPs frente a las 336 y 112 respectivamente de la RTX 3090 Ti.
Los SMT están a su vez dentro de una unidad hardware de alto nivel denominada GPC, siendo 11 en este caso, la cual incluye un motor de rasterizado dedicado, dos particiones de operaciones de rasterizado (ROP), a su vez con 8 ROP y 6 TPC con 2 SM en su interior. De esta forma se genera el chipset completo AD102 y el resto de variantes que darán vida a los modelos RTX 4000 contando con más o menos GPC en el interior.
Con cada generación llegan actualizaciones integrales en los núcleos internos, por ejemplo los 16384 CUDA Cores que forman el chipset AD102 de la 4090 son capaces de alcanzar 83 Shader-TFLOPS más del doble que en la arquitectura Ampere (40 TFLOPS). Esta mejor viene en gran medida gracias a la tecnología Shader Execution Reordering (SER) capaz de reprogramar el trabajo y colas de instrucciones sobre la marcha, duplicando su efectividad.
Los Tensor Core pasan a ser de 4ª generación y en un recuento de 512 unidades, cuya función es la de trabajo matricial, multiplicar y acumular operaciones matemáticas para IA y HPC. Son el motor de las redes neuronales utilizadas en DLSS, admitiendo un nuevo formato FP8 que se introdujo en la arquitectura Nvidia Hopper. En comparación con FP16, FP8 reduce a la mitad los requisitos de almacenamiento de datos, por lo que duplica la capacidad IA. De esta forma su capacidad de procesamiento se eleva hasta los 1,3 PetaFLOPS superando ya la barrera de los TeraFLOPS holgadamente.
El tercer componente dentro del SM son los núcleos RT que se dedican a procesar el raytriangle para generar los rayos de luz que inciden sobre los objetos. Existen un total de 128 RT Core de 3ª generación en el chipset de la Nvidia RTX 4090, los cuales duplican el rendimiento respecto a la 2ª generación de Ampere alcanzando los 191 RT-TFLOPS. Para ello introduce un Motor de micromapa de opacidad acelerando las pruebas x2 generando micromallas sobre la marcha para aumentar la densidad de geometría y darnos un mayor realismo.
La configuración de memoria comienza con un aumento en caché L2 dentro del chipset hasta alcanzar los 73,7 MB, así como una capacidad de caché L1 de 16384 KB. En cuanto a la VRAM dedicada, se mantiene en las mismas especificaciones que la RTX 3090 Ti con un total de 24 GB de tipo GDDR6X a una frecuencia de reloj de 1313 MHz o 21 Gbps efectivos. Generan un bus de 386 bits alcanzando un ancho de banda de 1.018 GB/s, es decir, se supera el Terabyte/s. Estas memorias siguen utilizando chips Micron con tecnología de operación PAM4 que por modulación de pulso permite trabajar con 2 bits por cada ciclo de reloj. Por supuesto será compatible con Resizable BAR tanto en CPU AMD como Intel.
Otra de las novedades de Ada Lovelace es que las GPU cuentan con dos encoders AV1 NVENC de 8ª generación para ofrecer mejor calidad de imagen a las mismas tasas de bits que H.265/H.264, siendo un gran añadido para streamings mientras jugamos. Esta versión es hasta un 40% más eficiente que Ampere y genera archivos más pequeños para un mejor rendimiento en la red. Los dos encoders pueden funcionar en paralelo, dividiendo el trabajo y ofreciendo gran calidad en resoluciones 4K. Este es un elemento muy importante hoy en día para creadores ya que no necesitarán capturadora para ofrecer gran calidad y bajo lag. Este puede ser un gran complemento para Nvidia Broadcast el software para retransmisiones con IA, seguimiento automático de cámara y eliminación automática de ruido.
DLSS 3 es una de las grandes novedades estrenadas junto a la arquitectura Lovelace. Nvidia tenía a AMD y su Super Resolution pisándole los talones, así que da otro giro de 180º a su tecnología de reescalado de imagen por IA y red neuronal. Sabiendo cómo funciona la versión previa DLSS 2.3 la nueva versión 3.0 utiliza IA para generar cuadros completamente nuevos en lugar de solo píxeles gracias a 4 nuevos componentes. Un nuevo Optical Flow Accelerator (Acelerador de Flujo Óptico) (OFA), vectores de movimiento del motor de juego, un marco IA autoencoder convolucional y el sistema Reflex super-low-latency.
Este nuevo DLSS procesa el nuevo cuadro junto al cuadro anterior para ver cómo están cambiando la escena. El OFA proporciona a la red neuronal la velocidad y dirección de los píxeles fotograma a fotograma para que esta genere marcos intermedios completamente nuevos sin necesidad de procesar los gráficos e involucrar el juego. El rendimiento llega a ser hasta 4 veces superior respecto a DLSS. DLSS 3.0 funcionará simultáneamente con DLSS Super Resolution (DLSS 2), siendo una técnica indispensable para juegos de mundo abierto exigentes como Cyberpunk 2077, A Plague Tale: Requiem o Flight Simulator.
El complemento Nvidia RTX Remix ya fue mostrado previamente al lanzamiento de Ada Lovelace remasterizando los gráficos de TES Morrowind y Portal. Se trata de un mecanismo de trazado de rayos capaz de transformar los juegos clásicos añadiendo luz y sombras por trazado de rayos mediante inteligencia artificial y DLSS. Eso sí la calidad o resolución de las texturas se queda igual, siendo tarea del modder en cuestión rediseñar estas texturas. El proceso utiliza un extractor USD (Universal Scene Description) que convierte los activos del juego en un marco 3D abierto para que la aplicación RTX Remix haga su trabajo. Se lanzará el kit de desarrollo NVIDIA RTX Path Tracing Software (SDK) para trabajar con trazado de rayos y gráficos neuronales para diseñadores.
Llegó el momento de ver la Nvidia RTX 4090 en acción a través de benchmarks y pruebas en juegos. El primer banco de pruebas se compone del siguiente hardware
RUEBAS | |
Procesador: | Intel Core i9-10850K |
Placa Base: | Asus Maximus Formula XII |
Memoria: | Kingston Fury Renegade DDR5 32GB@3600 MHz |
Disipador | Corsair H100i RGB Platinum SE |
Disco Duro | Samsung 860 QVO |
Tarjeta Gráfica | Nvidia GeForce RTX 4090 |
Fuente de Alimentación | Corsair RM1000 |
Monitor | Viewsonic VX3211 4K mhd |
Hemos ejecutado las pruebas sobre Windows 11 Pro 22H2 (22621.521) con los drivers Nvidia en su versión 521.90.
La jugabilidad de una tarjeta gráfica podemos valorarla en varios escalones según el framerate:
Escalones de rendimiento | |
Frames Por Segundo (FPS) | Jugabilidad |
Menos de 30 FPS | Injugable |
30 ~ 40 FPS | Jugable |
40 ~ 60 FPS | Buena |
Mayor de 60 FPS | Fluido / Consola |
Mayor de 144 FPS | Realista |
Para las pruebas de benchmark utilizaremos los siguientes programas:
En otro test relevante como es el de trazado de rayos Port Royal obtiene una mejora del 68% respecto a la 3090 Ti. Las cifras son realmente impresionantes, más cuanto mayor exigencia tenta el test y mayor resolución involucre. La prueba de PureRaytracing continúa mostrando diferencias abismales del superiores al 60% en las tres resoluciones.
Continuamos los análisis de la Nvidia RTX 4090 evaluando su rendimiento en juegos. Las pruebas las vamos a realizar a resoluciones Full HD, 2K, 4K y 8K. Para cada uno de los juegos, hemos mantenido los ajustes en calidad alta en la resolución 4K, mientras que en 8K hemos reducido la calidad a media o baja para obtener tasas lo más fluidas posible.
En las pruebas con juegos ocurre prácticamente lo mismo que vimos en las RTX 3090 y Ti de la anterior generación, y es que el Core i9-10850K hace cuello de botella en las pruebas de 1080p e incluso 2K. Esta CPU la jubilaremos ya con esta generación.
Así que debemos pasar a los test de 4K y 8K para estudiar la relevancia e incremento de los valors respecto a la anterior generación, demostrando que esta tarjeta está creada para trabajar por encima de 4K.
Obtenemos mejoras que van desde el 40% hasta el 60% e incluso más, algo que se esperaba en vista a los test preliminares que Nvidia había realizado. En igualdad de condiciones sobre pruebas en 8K obtenemos mejoras similares a 4K, superando el 60% en algunos títulos.
Vamos a probar ahora el rendimiento en juegos con Ray Tracing y DLSS, la misma configuración gráfica en calidad y en las mismas resoluciones que antes.
Igual que antes, los resultados que debemos mirar con esta CPU son a partir de 4K por ser donde se ve el verdadero potencial de la tarjeta gráfica.
Hemos probado su rendimiento en varios programas de diseño y renderizado para ver cómo se sitúa esta GPU frente a las otras gráficas:
En el test de renderizado de imagen de V-Ray las cifras siguen siendo muy superiores al anterior modelo más potente, hasta un 141% en el modo CUDA y un 83% en el modo RTX utilizando el mismo banco de pruebas que en la RTX 3090 Ti, por ser un test añadido recientemente a nuestra lista. En Otoy OctaRender casi se duplica la capacidad, mientras que en Blender la diferencia es más corta por la simple razón de ser un test que a esta RTX 4090 le queda pequeño.
Es momento de hacer una prueba de overclocking en la Nvidia RTX 4090. Hemos utilizado MSI Afterburner, extrayendo resultados mediante 3DMark Time Spy y pruebas a Shadow Of The Tomb Raider en las distintas resoluciones.
Shadow of the Tomb Raider | Stock | @ Overclock |
1920x1080p (Full HD) | 204 FPS | 203 FPS |
2560 x 1440p (2K) | 202 FPS | 198 FPS |
3840 x 2160p (4K) | 184 FPS | 187 FPS |
7680 x 4320p (8K) | 86 FPS | 92 FPS |
3DMark Time Spy | Stock | @ Overclock |
Graphics Score | 34809 | 34799 |
Physics Score | 12964 | 12871 |
Combinado | 27785 | 27716 |
Esta tarjeta gráfica es capaz de alcanzar los 2,9 GHz en overclocking manual, cifra obtenida tras elevar la frecuencia de reloj de la GPU 200 MHz, y 600 MHz efectivos en las memorias. Tales aumentos se traducen en mejoras poco apreciables en 4K y 8K con 3 y 6 FPS respectivamente, e incluso descensor de rendimiento en 2K y 1080p.
En el modelo de referencia parece que tenemos el Power Limit bastante capado, ya que apenas cambia su consumo pese a elevar las frecuencias de reloj. Los ventiladores a máximo rendimiento resultan bastante ruidosos, pero al menos bajan las temperaturas casi 10ºC a pesar de estar bajo overclocking.
Es el turno de verificar temperaturas y consumo de la Nvidia RTX 4090 sometiéndola a estrés mediante FurMark. Usaremos HWiNFO y GPU-Z para monitorizar los datos internos, la herramienta Nvidia PCAT que mide el consumo real de la GPU, y un vatímetro que mide el consumo de todo el banco de pruebas excepto el monitor. La temperatura ambiente en la habitación será de 23oC.
Fiel a lo prometido, esta Nvidia RTX 4090 muestra un consumo muy similar a la RTX 3090 Ti, sumando en conjunto del banco de pruebas cifras incluso por debajo de lo obtenido anteriormente en Ampere. El consumo individual registrado en GPU-Z difiere respecto a lo obtenido con la herramienta PCAT, siendo de 24W vs 70W en reposo, y de 457W vs 445W bajo carga. No es una diferencia muy elevada, pero nos fiamos más de la herramienta de medida física. Está claro que con un 12900K la PSU recomendada será de 1000W.
Las temperaturas en los chips de memoria GDDR6X son de 40ºC en reposo y 76ºC bajo estrés al menos en este modelo de referencia. Al menos son cifras mejores que las mostradas en Ampere, viéndose una mejora en el sistema de disipación para ellas. Las temperaturas en la GPU también están controladas y estables en todo momento sin utilizar el 100% de la capacidad de ventiladores.
A continuación llevaremos a cabo pruebas de rendimiento en las mismas condiciones de configuración, pero con la plataforma Intel Alder Lake para ver las mejoras obtenidas con un hardware más actual. El banco de pruebas se compone de:
BANCO DE PRUEBAS | |
Procesador: | |
Placa Base: | MSI MEG Z690 Unify |
Memoria RAM: | 32 GB Kingston Fury DDR5 5200MHz |
Disipador | MSI MEG Coreliquid S360 |
Disco Duro | |
Tarjeta Gráfica | Nvidia GeForce RTX 4090 |
Fuente de Alimentación | Corsair RM1000 |
Monitor | Viewsonic VX3211 4K mhd |
Las pruebas nos muestran una mejora media en 1080p del 13,8%, prácticamente en todos ellos, excepto algunos como Control por estar el juego limitado a 240 FPS, o Metro Exodus con Ray Tracing por ser muy dependiente de la GPU. En 2K se mantiene esta media de mejora, en 4K se reduce al 6,6% y en 8K ni tan siquiera hemos mostrado resultados por ser exactamente los mismos que con el 10850K al recibir toda la carga de operaciones y renderizado la tarjeta gráfica. Tengamos siempre en cuenta que, mientras mayor sea la resolución, mayor peso tiene la GPU.
Ya hemos visto en la descripción técnica qué mejoras aporta DLSS 3.0, ahora toca ver estas mejoras en números. Llevaremos a cabo estas pruebas nuevamente con el Intel Core i9-10850K, siempre en 4K.
La primera prueba específica de 3DMark muestra una gran diferencia entre el rendimiento con y sin DLSS 3.0, ya que la mejora es más del doble, aunque no deja de ser un benchmark cuya configuración detallada desconocemos.
En pruebas aplicadas a juegos reales, hemos obtenido mejoras de hasta el 165% en DLSS 3.0 modo Ultra Rendimiento en la demo de Unreal Engine LyraGame, partiendo de un aumento del 100% en el modo calidad.
Mientras tanto, en Cyberpunk 2077 hemos comparado el framerate directamente en gameplay entre DLSS 2.0, DLSS 3.0 y DLSS OFF, obteniendo una mejora superior al doble en 3.0 vs 2.0. Esta cifra se corresponde con la mejora prometida en la documentación de DLSS 3.0 respecto a la versión anterior, así que es una prueba bastante representativa.
En el resumen de pruebas comparativas para varios juegos con DLSS OFF vs DLSS 3.0 obtenemos mejoras en 4K de hasta el 240% en Cyberpunk 2077, el 233% en la demo Unity Enemies, o del 145% en F1 2022, todas ellas medidas en 4K.
Tenemos ante nosotros la tarjeta gráfica que definirá la vara de medir para la nueva generación, una bestia impresionante que ha mostrado mejoras en torno al 60% e incluso más respecto a la RTX 3090 Ti en Benchmarks y juegos en resolución 4K y 8K. Claramente es una GPU concebida para el renderizado y trabajos por encima de resoluciones UHD, ya que los resultados en 1080p y 2K son incluso discretos al tener como limitador las propias CPU.
El brutal incremento de unidades de procesamiento respecto al flagship de la generación anterior nos deja increíbles tiempos de renderizado gracias a la mejora de IPC y frecuencias que rozan los 3,0 GHz en el troquel de 4 nm. Todo esto manteniendo el mismo consumo que Ampere y buenas temperaturas, aunque pagamos el precio con disipadores exageradamente grandes.
Visita nuestra guía de las mejores tarjetas gráficas del mercado
A todo esto se le suman las mejoras internas de arquitectura y actualizaciones de tecnologías clave como es el doble encoder AV1 implementado en la GPU que permitirá a los streamers y creadores sacar mucho más rendimiento en su trabajo. DLSS 3.0 marca una nueva cota de rendimiento, incluso duplicando en algunos casos la anterior versión gracias a Optical Flow Accelerator y Nvidia Reflex entre otras mejoras.
Sin duda esta Nvidia RTX 4090 nos da justamente lo que promete, pero su precio más allá de sólo rascarse el bolsillo con 1959€ el día de su lanzamiento oficial, cifra similar a los modelos custom que saldrán justamente después. La guerra de fabricantes está por todo lo alto y hace crear productos más o más potentes, pero pocos se podrán permitir semejante lujo.
VENTAJAS | INCONVENIENTES |
POTENCIA A RAUDALES | PRECIO |
SE LE SACARÁ PARTIDO A PARTIR DE 4K HACIA ARRIBA | TAMAÑO GIGANTESCO |
60% MÁS DE POTENCIA QUE LA RTX 3090 TI CONSUMIENDO LO MISMO | |
TEMPERATURAS BUENAS Y CONTROLADAS | |
ENCODER DUAL AV1 IDEAL PARA STREAMERS Y CREADORES | |
DLSS 3.0 Y MUCHAS NOVEDADES EN BROADCAST |
El equipo de profesional review le otorga la medalla de platino
Nvidia RTX 4090 es el caballo de batalla definitivo con arquitectura Ada Lovelace, tan impresionante en rendimiento como en tamaño y precio
Las tarjetas gráficas RTX 5090 y RTX 5080 de Nvidia no cuentan con aumentos sustanciales…
Probamos antes de su lanzamiento la versión B860-F, ahora le toca el turno a la…
Ryzen Z2 Go sería un 10 % más lento que el Ryzen Z1 Extreme. Poco…