AMD ha svelato la sua nuova APU Ryzen AI MAX+ 395 “Strix Halo”, un processore rivoluzionario che supera di oltre tre volte le prestazioni della RTX 5080 nei benchmark AI DeepSeek R1.
Ryzen AI MAX+ 395: L’APU che ridefinisce l’AI nei laptop
Il Ryzen AI MAX+ 395 rappresenta un enorme passo avanti per l’intelligenza artificiale nei dispositivi consumer. Questo chip unisce i core Zen 5 con una NPU XDNA 2 da 50 TOPS e una potente GPU integrata, garantendo prestazioni AI eccezionali per laptop premium sottili e leggeri.
Le sue capacità emergono soprattutto nell’esecuzione locale di modelli AI avanzati, come gli LLM, offrendo significativi vantaggi di performance rispetto alla concorrenza. Ad esempio, nelle applicazioni come LLama.cpp e LM Studio, consente di eseguire i modelli linguistici più recenti direttamente sul dispositivo, senza necessità di competenze tecniche.
Vantaggi principali rispetto alla concorrenza Copilot+
Prestazioni AI
- 2,2 volte il throughput token di Intel Arc 140V
- 4 volte più veloce nel tempo di generazione del primo token per modelli come Llama 3.2 3B Instruct
- 9,1 volte più veloce per modelli AI con 7-8 miliardi di parametri
- 12,2 volte più veloce di Intel Core Ultra 258V per modelli con 14 miliardi di parametri
Modelli di visione
- 7 volte più veloce in IBM Granite Vision 3.2 3B
- 4,6 volte più veloce in Google Gemma 3 4B
- 6 volte più veloce in Google Gemma 3 12B
Memoria e VRAM
- Fino a 128 GB di memoria unificata, rispetto ai 32 GB massimi della concorrenza
- 96 GB trasformabili in VRAM con Variable Graphics Memory
- Possibilità di gestire modelli AI più grandi, come Google Gemma 3 27B Vision, irraggiungibili per altre APU
Il vantaggio della VRAM: Ryzen AI MAX+ 395 vs RTX 5080
AMD dimostra nei benchmark come il Ryzen AI MAX+ 395, con 128 GB di memoria unificata, possa superare le GPU discrete di NVIDIA, tra cui la RTX 5080. Quando i modelli AI superano i 16 GB di VRAM, il 395 offre prestazioni superiori fino a 3,05 volte rispetto alla GPU dedicata.
La RTX 5080 è infatti limitata a 16 GB di VRAM, mentre la RTX 5090, pur arrivando a 32 GB, ha un consumo energetico molto elevato (360W per la 5080 e 575W per la 5090).
Per modelli AI che rientrano nei limiti VRAM delle GPU discrete, la serie RTX 50 mantiene ancora un vantaggio, ma Strix Halo si conferma una soluzione AI integrata altamente competitiva, combinando prestazioni elevate e efficienza energetica in un unico chip.
0 commenti