Intel Habana Gaudí2: aprendizaje profundo con 24 TPC y 96 HBM2e

Intel ha presentado hoy oficialmente sus aceleradores de aprendizaje profundo Habana Gaudi2 y Greco, que prometen duplicar el rendimiento en este segmento con respecto a las gráficas Ampere A100.

Habana Gaudí2 y Greco: Los nuevos aceleradores de aprendizaje profundo de Intel

Ambos aceleradores están fabricados con una tecnología de nodo de 7 nm, aunque no sabemos si se trata del nodo Intel 7 o si se trata de un nodo de 7 nm de TSMC. Estos aceleradores fueron desarrollados por los laboratorios de ‘Intel habana’, que ofrecerían un alto porcentaje de entrenamiento y/o inferencia de DL.

Habana Gaudi2

Gaudí2 está contando con 24 TPC para la decodificación y el procesamiento de medios que se ejecutan en un formato FP8. Intel ha logrado aumentar un 50% la densidad de transistores con respecto a la primera versión de Gaudi, que estaba fabricada en un nodo de 16 nm.

La capacidad de memoria es de 96 GB HBM2e con un ancho de banda de 2,45 TB/s y 48 MB adicionales de SRAM. La red cuenta con unos 24 switches de 100 GbE, mientras que el consumo eléctrico alcanzaría los 600 W TDP.

En las pruebas de rendimiento de ResNet-50, existe una ganancia del 90% con respecto a la GPU A100 de Nvidia. En las pruebas de NLP BERT, el Habana Gaudi2 logra superar a la GPU A100 en hasta un 70% en fase 1 y 180% en fase 2.

Habana Greco

Estas tarjetas de inferencia de aprendizaje profundo están diseñadas para obtener la máxima eficiencia. El acelerador posee 16 GB de memoria LPDDR5 a 240 GB/s y 128 MB adicionales de SRAM. El TDP es de tan solo 75W.

En comparación con el módulo OAM del Gaudi2, el Greco viene en un factor de forma HHHL de una sola ranura.

Intel también ha anunciado que el procesador Gaudi2 de 7nm está disponible para los clientes a partir de ahora, mientras que el Greco llegará en algún momento del segundo semestre d este año.

Fuente