Intel Gaudi 3: acceleratore AI di ultima generazione

da | Apr 9, 2024 | 0 commenti

Intel annuncia il nuovo acceleratore per Intelligenza Artificiale che offre prestazioni superiori a Gaudi 2 e compete con Nvidia H100.

È interessante notare che Intel sta affrontando il divario nell’intelligenza artificiale generativa attraverso il lancio dell’acceleratore AI Intel Gaudi 3. Questo evento è avvenuto durante l’Intel Vision Event il 9 aprile 2024 a Phoenix, in Arizona. Gaudi 3 offre ai clienti la possibilità di scegliere con un software aperto basato sulla comunità e una rete Ethernet standard del settore per scalare i propri sistemi in modo più flessibile. Questo è un passo significativo verso la democratizzazione dell’AI e potrebbe avere un impatto significativo sul modo in cui le organizzazioni implementano e utilizzano le tecnologie di intelligenza artificiale.

 

 

È interessante notare che gli acceleratori AI Gaudi di Intel sono stati visti come una significativa alternativa alle GPU NVIDIA nel segmento dell’IA. Recentemente, abbiamo assistito a dibattiti accesi su benchmark tra le GPU Gaudi 2 e le NVIDIA A100/H100, con Intel che ha dimostrato un forte vantaggio in termini di rapporto prestazioni/costo, mentre NVIDIA è rimasta leader generale in termini di prestazioni nell’ambito dell’intelligenza artificiale. Con l’introduzione del Gaudi 3, Intel dà il via al terzo capitolo del suo viaggio nell’IA, con il nuovo acceleratore che promette di offrire prestazioni ancora più elevate e una maggiore flessibilità di scalabilità per i clienti. La competizione tra Intel e NVIDIA nel campo dell’IA promette di essere sempre più interessante e potrebbe portare a ulteriori innovazioni e miglioramenti nelle tecnologie di intelligenza artificiale.

L’annuncio dell’acceleratore Gaudi 3 rivela un potente hardware con numerose caratteristiche avanzate. Questo acceleratore presenta l’ultima architettura Tensor Core di quinta generazione, che include un totale di 64 tensor core racchiusi in due die di calcolo. La GPU è dotata di un pool di cache da 96 MB condiviso su entrambi i die, garantendo un’efficiente gestione delle risorse e un rapido accesso ai dati. Inoltre, sono presenti otto siti HBM, ciascuno con stack da 8-hi di DRAM HBM2e da ​​16 Gb, offrendo una capacità fino a 128 GB e una larghezza di banda impressionante fino a 3,7 TB/s.

Da notare che l’intero chip è fabbricato utilizzando la tecnologia del nodo di processo TSMC a 5 nm, che rappresenta uno dei processi di produzione più avanzati disponibili attualmente. Inoltre, sono presenti un totale di 24 collegamenti di interconnessione da 200 GbE, consentendo una comunicazione rapida e efficiente tra i diversi componenti del sistema.

Queste specifiche indicano chiaramente che l’acceleratore Gaudi 3 è progettato per offrire prestazioni elevate e un’ottima scalabilità per una vasta gamma di carichi di lavoro di intelligenza artificiale. Con un focus sull’efficienza energetica, sulla larghezza di banda e sulla capacità di elaborazione parallela, questo chip potrebbe avere un impatto significativo sul settore dell’IA e delle tecnologie correlate.

In termini di offerta di prodotti, gli acceleratori AI Intel Gaudi 3 saranno disponibili in diverse configurazioni per adattarsi alle esigenze di diversi ambienti e carichi di lavoro. Queste configurazioni includono:

  1. Mezzanine OAM (HL-325L): Questo formato offre varianti standard fino a 900 W di potenza e varianti raffreddate a liquido per potenze superiori a 900 W. Il fattore di forma Mezzanine OAM è progettato per l’integrazione in sistemi di data center ad alte prestazioni.
  2. PCIe AIC (Adaptive Input/Output Card): Queste schede PCIe Gaudi 3 HL-338 sono caratterizzate da altezza intera, doppia larghezza e design di 10,5 pollici di lunghezza. Offrono una maggiore flessibilità di installazione, adatte per sistemi che richiedono schede di espansione PCIe standard.

Entrambe le varianti, sia Mezzanine OAM che PCIe AIC, offrono specifiche simili. Ad esempio, le schede PCIe Gaudi 3 HL-338 supporteranno un TDP fino a 600 W e condivideranno le stesse specifiche della variante OAM, garantendo uniformità di prestazioni e funzionalità tra i due formati.

Questo approccio multi-formato consente agli utenti di selezionare l’acceleratore Gaudi 3 più adatto alle loro esigenze di implementazione, consentendo una maggiore flessibilità nell’integrazione e nell’ottimizzazione dei sistemi di intelligenza artificiale.

L’azienda ha annunciato non solo l’acceleratore Gaudi 3, ma anche il baseboard HLB-325 e il sottosistema integrato HLFB-325L, che possono ospitare fino a 8 acceleratori Gaudi 3. Questo sistema è caratterizzato da un TDP combinato di 7,6 kilowatt e ha una dimensione di 19″.

Inoltre, il seguito del Gaudi 3 arriverà sotto forma di Falcon Shores, previsto per il 2025. Questa nuova generazione combinerà sia gli IP Gaudi che quelli Xe in un’unica interfaccia di programmazione GPU costruita attorno alla specifica Intel oneAPI. Questo suggerisce un approccio integrato e unificato all’implementazione e alla programmazione di carichi di lavoro di intelligenza artificiale, offrendo ai clienti una maggiore flessibilità e facilità d’uso nell’adozione delle tecnologie Intel per l’IA.

About Gianni Marotta
Nvidia RTX 5090 Blackwell GB202 chip da 744 mm2

Nvidia RTX 5090 Blackwell GB202 chip da 744 mm2

La GPU NVIDIA Blackwell GB202, destinata alla GeForce RTX 5090, avrà un die significativamente più grande rispetto all'attuale modello Ada di punta ovvero alla RTX 4090. La nuova scheda promette miglioramenti prestazionali notevoli e sarà la punta di diamante della...

COMMENTI

Lasciando un commento dichiari di accettare ed aver preso nota della Cookie Policy e GDPR Policy di Pcgaming.Tech.

0 commenti

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *