La arquitectura Hopper y el chip H100 fue presentada por Nvidia en el GTC, su propio evento en donde hizo el anuncio oficial la GPU de próxima generación para servidores y centro de datos. No confundir Hopper con Ada Lovelace, que si va a estar enfocada en el consumidor masivo.
Nvidia H100 ‘Hopper’ es presentado con 16896 núcleos CUDA
La GPU H100 de Nvidia va a reemplazar al A100 de arquitectura Ampere, potenciando el rendimiento para los centros de datos y el HPC.
El gran chip H100 contendrá más de 80.000 millones de transistores en su encapsulado, fabricado con un nodo de 4 nm. Este es la primera GPU que utiliza un nodo de estas características. En comparación, el A100 de arquitectura Ampere tiene unos 54.000 millones de transistores.
Visita nuestra guía sobre las mejores tarjeta gráficas del mercado
La cantidad de núcleos CUDA que posee esta GPU asciende a los 16896 núcleos (FP32) y 528 núcleos Tensor. El A100 poseía 6912 núcleos CUDA, por lo que el salto es enorme.
Se está utilizando una memoria del tipo HBM3 de 80GB con una velocidad de reloj de 4.8 Gbps, con un bus de 5120 bit el ancho de banda alcanza los 3 TB/s.
El desempeño que alcanza esta GPU es de 60 TFLOPS FP32 Vector y 30 TFLOPS en FP64 vector. Frente al A100, la diferencia de rendimiento es notable, de 19.5 TFLOPS y 9.7 TFLOPS, respectivamente.
El H100 también es compatible con la cuarta generación de la interfaz NVLink, que puede ofrecer hasta 128 GB/s de ancho de banda. La compatibilidad con la interfaz de conexión PCIe 5.0 también está presente aquí, que alcanza un máximo de 128 GB/s.
La GPU estará disponible inicialmente como un nuevo servidor DGX H100 montado en rack. Cada sistema DGX H100 contiene ocho GPU H100, que proporcionan hasta 32 PFLOPS de cálculo de IA y 0,5 PFLOPS de FP64. La cantidad de memoria máxima es de 640 GB HBM3, y un ancho de banda de 3,6 TB/s bisección.
Nvidia está afirmando que rendimiento de los nuevos algoritmos DPX son hasta 7 veces más rápido que el de sus GPU de generación anterior, y hasta 40 veces más rápido que los algoritmos basados en la CPU.
Pueden ver más información sobre el H100 en el siguiente enlace.