News

Microsoft svela Fairwater: il datacenter AI più potente al mondo

Punti salienti dell'articolo:
  • Microsoft presenta Fairwater, il datacenter AI più potente al mondo con prestazioni 10x superiori
  • Investimenti multimiliardari in 3 nuovi datacenter AI in Wisconsin, Norvegia e Regno Unito
  • Architettura NVIDIA GB200 con 72 GPU per rack e throughput di 865.000 token al secondo
  • Sistema di raffreddamento a liquido a circuito chiuso con zero sprechi d'acqua
  • AI WAN connette datacenter globalmente per creare un supercomputer distribuito
  • Infrastruttura storage da exabyte per supportare carichi di lavoro AI su larga scala
  • Azure primo cloud provider a implementare server NVIDIA GB200 su scala datacenter
Microsoft svela Fairwater: il datacenter AI più potente al mondo

Introduzione

Microsoft ha inaugurato una nuova era nell'infrastruttura AI con la presentazione di Fairwater, il datacenter AI più grande e sofisticato mai costruito dall'azienda. Situato nel Wisconsin, questo impianto rappresenta un investimento multimiliardario che ridefinisce completamente il concetto di supercomputing per l'intelligenza artificiale.

La rivoluzione dei datacenter AI

Un datacenter AI è una struttura specializzata progettata specificamente per l'addestramento e l'esecuzione di modelli di intelligenza artificiale su larga scala. A differenza dei datacenter cloud tradizionali, ottimizzati per gestire numerosi carichi di lavoro indipendenti come siti web ed email, i datacenter AI funzionano come un unico supercomputer massivo.

Fairwater si estende su 315 acri e ospita tre enormi edifici per un totale di 1,2 milioni di piedi quadrati. La costruzione ha richiesto 46,6 miglia di fondazioni profonde, 26,5 milioni di libbre di acciaio strutturale e 120 miglia di cavi sotterranei a media tensione.

Architettura e prestazioni

Il cuore del datacenter è costituito da cluster interconnessi di server NVIDIA GB200 con milioni di core di calcolo ed exabyte di storage. Ogni rack contiene 72 GPU NVIDIA Blackwell, collegate in un singolo dominio NVLink che fornisce 1,8 terabyte di larghezza di banda GPU-to-GPU e accesso a 14 terabyte di memoria condivisa.

Questa configurazione permette al rack di operare come un singolo acceleratore gigante, capace di elaborare 865.000 token al secondo - il throughput più alto disponibile su qualsiasi piattaforma cloud oggi. Il datacenter fornirà prestazioni 10 volte superiori rispetto al supercomputer più veloce attuale.

Networking avanzato per l'AI

Per garantire comunicazioni a bassa latenza su più livelli, Microsoft ha implementato un'architettura di rete sofisticata. A livello di rack, le GPU comunicano tramite NVLink e NVSwitch a terabyte al secondo. Per connettere i rack in un pod, Azure utilizza fabric InfiniBand ed Ethernet che forniscono 800 Gbps in un'architettura full fat tree non-blocking.

Innovazioni nel raffreddamento

Il raffreddamento tradizionale ad aria non può gestire la densità dell'hardware AI moderno. Fairwater utilizza sistemi avanzati di raffreddamento a liquido con tubazioni integrate che circolano liquido freddo direttamente nei server, estraendo il calore in modo efficiente.

Il sistema a circuito chiuso garantisce zero sprechi d'acqua, necessitando di riempimento solo una volta durante la costruzione e riutilizzando continuamente l'acqua senza perdite per evaporazione. Oltre il 90% della capacità del datacenter utilizza questo sistema, supportato dal secondo impianto di refrigerazione ad acqua più grande del pianeta.

Storage e compute per l'AI

Per supportare il cluster di infrastruttura AI, è necessaria un'infrastruttura datacenter completamente separata per archiviare ed elaborare i dati utilizzati e generati dal cluster AI. I sistemi di storage del datacenter Wisconsin si estendono per la lunghezza di cinque campi da football.

Microsoft ha riprogettato Azure Storage per i carichi di lavoro AI più impegnativi. Ogni account Azure Blob Storage può sostenere oltre 2 milioni di transazioni di lettura/scrittura al secondo, con milioni di account disponibili per scalare elasticamente secondo qualsiasi requisito di dati.

AI WAN: la rete globale dei datacenter AI

Questi nuovi datacenter AI fanno parte di una rete globale di datacenter Azure AI, interconnessi tramite Wide Area Network (WAN). Non si tratta solo di un edificio, ma di un sistema distribuito, resiliente e scalabile che opera come un'unica potente macchina AI.

Questo rappresenta un cambio fondamentale nel modo di concepire i supercomputer AI. Invece di essere limitati dalle pareti di una singola struttura, Microsoft sta costruendo un sistema distribuito dove risorse di calcolo, storage e networking sono unificate e orchestrate attraverso regioni datacenter diverse.

Espansione globale

Oltre a Fairwater, Microsoft ha annunciato piani per altri datacenter AI strategici:

  • Narvik, Norvegia: partnership con nScale e Aker JV per sviluppare un nuovo datacenter AI hyperscale
  • Loughton, Regno Unito: collaborazione con nScale per costruire il supercomputer più grande del UK
  • Multipli datacenter Fairwater identici in costruzione in altre località negli Stati Uniti

 

Conclusione

Il datacenter Fairwater di Microsoft rappresenta un investimento multimiliardario che ridefinisce l'infrastruttura AI globale. Con centinaia di migliaia di chip AI all'avanguardia e connessioni perfette con la rete globale Microsoft Cloud di oltre 400 datacenter in 70 regioni, questi impianti democratizzano l'accesso ai servizi AI su scala globale.

L'approccio distribuito di Microsoft, dove software e hardware sono ottimizzati come un unico sistema purpose-built, sta inaugurando una nuova era di intelligenza cloud-powered, sicura, adattiva e pronta per il futuro dell'AI.

FAQ

Che cos'è un datacenter AI e come differisce da un datacenter tradizionale?

Un datacenter AI è una struttura specializzata progettata per l'addestramento e l'esecuzione di modelli AI su larga scala, che funziona come un unico supercomputer massivo invece di gestire carichi di lavoro indipendenti come i datacenter tradizionali.

Quanto è potente il datacenter AI Fairwater di Microsoft?

Fairwater fornirà prestazioni 10 volte superiori rispetto al supercomputer più veloce attualmente disponibile, con rack capaci di elaborare 865.000 token al secondo.

Quali chip utilizza Microsoft nei suoi datacenter AI?

Microsoft utilizza server NVIDIA GB200 con GPU Blackwell, e i futuri datacenter in Norvegia e Regno Unito useranno chip GB300 con ancora più memoria condivisa per rack.

Come funziona il raffreddamento nei datacenter AI Microsoft?

Microsoft utilizza sistemi avanzati di raffreddamento a liquido a circuito chiuso che circolano liquido freddo direttamente nei server, garantendo zero sprechi d'acqua e riutilizzo continuo.

Dove sta costruendo Microsoft i nuovi datacenter AI?

Microsoft sta costruendo datacenter AI in Wisconsin (Fairwater), Norvegia (Narvik), Regno Unito (Loughton) e multiple altre località negli Stati Uniti.

Come si connettono tra loro i datacenter AI Microsoft?

I datacenter AI sono interconnessi tramite AI WAN (Wide Area Network) che permette di operare come un unico sistema distribuito per addestramento AI su larga scala attraverso regioni geograficamente diverse.

Introduzione Microsoft ha inaugurato una nuova era nell'infrastruttura AI con la presentazione di Fairwater, il datacenter AI più grande e sofisticato mai Evol Magazine
Tag:
Microsoft