Intel ha estado en el Vision 2024 para contarnos varias novedades, entre las que se encuentra su próxima aceleradora de IA Gaudi 3.
Intel Gaudi 3: Hasta un 40% más rápido que Nvidia H100 e iguala al H200
Gaudi 3 son las próximas aceleradoras de inteligencia artificial de Intel que está siendo fabricada con un nodo de 5 nm y que estará disponible en algún momento de este segundo trimestre de 2024 para algunos de los socios más importantes de la compañía, como Dell, HPE, Lenovo y Supermicro.
El fabricante asegura que Gaudi 3 es hasta un 40% más rápido que las aceleradoras H100 de Nvidia en términos de rendimiento de IA, y ha mostrado algunas diapositivas para demostrarlo. Al compararlo con Gaudi 2, Intel dice que se hasta dos veces más rápido en precisión FP8 y hasta cuatro veces más rápido en precisión BF16. Además, está ofreciendo el doble de ancho de banda de red y hasta un 50% más de ancho de banda de memoria.
Intel Gaudi 3 vs Nvidia H100
El resumen es bastante contundente en este aspecto. La opción de Intel sería un 50% más rápido en inferencia de IA y hasta un 40% en eficiencia energética. Para la comparativa utilizaron distintos modelos de IA.
Intel Gaudi 3 vs Nvidia H200
La comparativa más interesante es frente al H200, que se lanzaría también durante el segundo trimestre de este año 2024.
Las diapositivas muestran que Gaudi tiene un rendimiento bastante similar al H200, pero obtiene una importante victoria en las pruebas de inferencia en Falcon, donde consigue un rendimiento de hasta 3.8 veces superior.
Te recomendamos nuestra guía sobre las mejores tarjetas gráficas del mercado
«Todo esto en conjunto proporciona un salto significativo en rendimiento y productividad para el entrenamiento e inferencia de IA en muchos de los populares modelos de lenguaje grande y modelos multimodales», dijo Das Kamhout, vicepresidente e ingeniero principal senior en Intel Data Center and AI Group, en un evento previo a la sesión informativa.
«En general, creemos firmemente que Intel Gaudi 3 brinda opciones a las empresas cuando evalúan consideraciones como viabilidad, rendimiento, costo y eficiencia energética», añadió.
Disponibilidad
Como comentamos antes, estará disponible en el segundo trimestre en tres formatos: tarjeta aceleradora, una placa base universal y una tarjeta complementaria PCI-Express. Pueden ver más información sobre las novedades del evento Vision 2024 en el sitio de Intel.