STORM Transformer Raggiunge l'Assimilazione di Dati Generativa Exascale sul Supercomputer Frontier
Un nuovo framework di assimilazione di dati generativa è stato introdotto per affrontare un collo di bottiglia fondamentale nella previsione del sistema terrestre. Questo approccio riformula l'assimilazione come campionamento bayesiano a posteriori, sostituendo i tradizionali cicli di previsione-aggiornamento con inferenza computazionalmente densa ed efficiente per GPU. Al suo centro c'è STORM, un trasformatore spaziotemporale dotato di un algoritmo di scaling lineare dell'attenzione globale che supera le limitazioni dell'attenzione quadratica. Sul supercomputer Frontier utilizzando 32.768 GPU, il metodo ha dimostrato un'efficienza di scaling forte del 63% mantenendo prestazioni di 1,6 ExaFLOP. Il sistema scala ulteriormente per gestire 20 miliardi di token spaziotemporali. Previsioni meteorologiche e climatiche accurate dipendono dall'assimilazione di dati, che stima gli stati del sistema terrestre combinando osservazioni con modelli. Sebbene il calcolo exascale abbia avanzato le capacità di simulazione terrestre, l'inferenza scalabile e precisa degli stati del sistema terrestre rimane impegnativa, limitando la quantificazione dell'incertezza e la previsione di eventi estremi.
Fatti principali
- Framework di assimilazione di dati generativa introdotto per la previsione del sistema terrestre
- Riformula l'assimilazione come campionamento bayesiano a posteriori
- Utilizza inferenza computazionalmente densa ed efficiente per GPU invece di cicli di previsione-aggiornamento
- Il trasformatore STORM presenta un algoritmo di scaling lineare dell'attenzione globale
- Supera la barriera dell'attenzione quadratica
- Raggiunto il 63% di efficienza di scaling forte sul supercomputer Frontier
- Mantenute prestazioni di 1,6 ExaFLOP su 32.768 GPU
- Scala fino a 20 miliardi di token spaziotemporali
Entità
Istituzioni
- Frontier