Categories: breaking News

Microsoft Maia 200: il nuovo chip per l’inferenza AI a 3nm

(Adnkronos) – Il settore tecnologico sta attraversando una transizione fondamentale: dalla fase di sperimentazione dei modelli di intelligenza artificiale alla creazione di un'infrastruttura solida e scalabile per l'uso reale. In questo contesto, Microsoft ha annunciato Maia 200, un acceleratore di AI di nuova generazione progettato per ottimizzare le prestazioni, ridurre i consumi energetici e abbattere i costi operativi su scala globale. Mentre l'addestramento dei modelli (training) ha dominato il dibattito tecnologico degli ultimi anni, l'attenzione si sta ora spostando sull'inferenza. Si tratta del processo in cui l'AI risponde concretamente ai prompt, genera contenuti o supporta decisioni in tempo reale. Maia 200 è stato sviluppato partendo dal presupposto che "l'inferenza è il momento in cui l'AI fa davvero la differenza". Sebbene tradizionalmente sia stato utilizzato hardware generico o mutuato dal training, spesso potente ma eccessivamente costoso e poco efficiente, Maia 200 si presenta come la prima piattaforma integrata "espressamente per l'inferenza AI, con l'obiettivo di migliorare in modo significativo costo, latenza ed efficienza energetica". Realizzato con il processo produttivo a 3 nanometri di TSMC, ogni chip Maia 200 integra oltre 140 miliardi di transistor. L'architettura è stata ridisegnata nei suoi elementi fondamentali:
Gestione della memoria: sistema ottimizzato per mantenere i dati vicini ai core di calcolo, minimizzando i colli di bottiglia.
Networking: infrastruttura di rete potenziata per ridurre la latenza nei carichi di lavoro distribuiti.
Formati numerici: ottimizzazione di formati ridotti per elaborare i carichi di lavoro con minor dispendio energetico e di memoria. Secondo i dati tecnici forniti, il sistema garantisce "prestazioni per dollaro migliori del 30% rispetto all'hardware di ultima generazione", consentendo di eseguire i modelli generativi più complessi con un numero ridotto di chip e un costo per risposta inferiore. La distribuzione dei primi sistemi Maia 200 è già stata avviata nella regione Azure US Central, con una roadmap che prevede l'espansione verso la regione US West 3 e altri nodi globali nei prossimi mesi. L'impatto tecnologico sarà visibile direttamente nei servizi quotidiani. L'acceleratore supporterà infatti i workload di Microsoft 365 Copilot, la generazione di dati sintetici e le esperienze avanzate di Microsoft Foundry. L'obiettivo dichiarato è garantire che le capacità AI possano scalare "senza aumentare il consumo energetico o l'overhead operativo", rendendo la tecnologia "accessibile e pronta per la vita di tutti i giorni".
—tecnologiawebinfo@adnkronos.com (Web Info)

Tags: adnkronostecnologia

4 mesi ago

staff

Next Elina Svitolina, chi è la tennista ucraina in semifinale agli Australian Open »

Previous « Novità sul rinnovo del CCNL di ANAS: accordo e dettagli

Stage JRC ottobre 2026 in Italia, Germania, Paesi Bassi, Spagna e Belgio

Posti limitati: 50 stage JRC in diversi paesi europei, destinati in particolare a profili scientifici ma aperti anche a studi…

8 minuti ago

News

Sciopero nazionale 18 maggio 2026: trasporti, scuole e servizi a rischio

Tutti i dettagli sulla mobilitazione nazionale del 18 maggio 2026 e le indicazioni per evitare disagi

57 minuti ago

GUIDE

Inserimento lavorativo delle persone con disabilità: guida pratica per le imprese

Scopri pratiche, ruoli e strumenti per inserire persone con disabilità in azienda in modo sostenibile e sicuro

6 ore ago

News

Tutte le date degli scioperi di maggio 2026 e come prepararsi

Controlla il calendario degli scioperi di maggio 2026 per evitare ritardi: tutte le date e le raccomandazioni per pendolari e…

7 ore ago

GUIDE

Concorsi centri per l’impiego: materie, esercitazioni e risorse

Guida compatta alle materie, agli strumenti di esercitazione e alle risorse pensate anche per chi non ha studiato diritto

9 ore ago

GUIDE

Infortunio durante la pausa: orientamenti della Cassazione sull’occasione di lavoro

Spiegazione chiara della pronuncia della Cassazione 8 novembre 2026, n. 32473: quando un infortunio fuori dall'ufficio può essere considerato «occasione…

12 ore ago