AMD vuelve a la cara contra Nvidia con sus aceleradoras Radeon Pro W7800/7900 para profesionales, que parecen ofrecer hasta 7 veces más rendimiento que la RTX 4090 en DeepSeek R1.
Radeon Pro W7800 / W7900: 7 veces más rápido que la RTX 4090 en DeepSeek R1
Las tarjetas gráficas aceleradoras Radeon Pro W7800/7900 parecen tener una ventaja importante frente a la RTX 4090 gracias a la mayor capacidad de memoria, que es de 48 GB frente a los 24 GB de la opción de Nvidia, aunque esta GPU no es para profesionales, pero AMD lo utiliza para esta comparativa.
David McAfee, vicepresidente y director general de CPU Ryzen y gráficos Radeon de AMD, publicó en su cuenta de X que las tarjetas Radeon Pro W7900 y Pro W7800 de 48 GB pueden superar a una RTX 4090 en hasta 7,3 veces en las pruebas de DeepSeek R1.
Te recomendamos nuestra guía sobre las mejores tarjetas gráficas del mercado
Comparativa de rendimiento
https://twitter.com/McAfeeDavid_AMD/status/1900205339095486551?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1900205339095486551%7Ctwgr%5Efbd95397ec030d2c0594feaa9553b92faaee97ef%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.tomshardware.com%2Fpc-components%2Fgpus%2Famd-rdna-3-professional-gpus-with-48gb-can-beat-nvidia-24gb-cards-in-ai-putting-the-large-in-llm
En el gráfico podemos ver a las aceleradoras Radeon Pro W7900 y Pro W7800 compitiendo frente a la RTX 4090 con varias iteraciones de DeepSeek R1 con LM Studio 0.3.12 y el entorno de ejecución Llama.cpp 1.18. Las iteraciones de DeepSeek R1 consistieron en Distill Qwen 32B de 8 bits, Distill Llama 70B de 4 bits, Distill Qwen 32B de 8 bits y Distill Llama 70B de 4 bits.
Los primeros dos tienen una configuración para generar indicaciones conversacionales (con 20 tokens) y la segunda, indicaciones de resumen (con 3017 tokens).
DeepSeek R1 Distill Qwen 32B de 8 bits:
- El resultado de la RTX 4090 produjo 2,7 tokens por segundo, Pro W7800 unos 19,1 tokens y la Pro W7900 obtuvo 19,8 tokens por segundo.
Distill Llama 70B de 4 bits:
- Aquí la RTX 4090 produjo 2,3 tokens por segundo, la Pro W7800 hizo 12,8 tokens, y la Pro W7900 obtendría unos 12,7 tokens por segundo.
Distill Qwen 32B de 8 bits:
- La RTX 4090 produjo 2,5 tokens por segundo, la Pro W7800 unos 15,7 tokens y la Pro W7900 produjo unos 16,2 tokens.
Distill Llama 70B R1 de 4 bits:
- RTX 4090 produjo dos tokens por segundo, Pro W7800 produce 10,1 tokens y la Pro W7900 obtiene 10,4 tokens por segundo.
La diferencia más grande que se ha visto es con Distill Qwen 32B de 8 bits con una mejora de hasta el 7,3 veces.
David McAfee está asegurando que la capacidad de memoria VRAM de sus aceleradoras Radeon Pro permiten ejecutar modelos DeepSeek R1 más grandes.
El modelo W7900 tiene un precio de 3.500 dólares, unos 2000 dólares por encima de la RTX 4090.