I modelli grafici di fondazione su scala exascale abilitano la scoperta di materiali su scala miliardaria in pochi secondi

ai-technology · 2026-04-20

È stato introdotto un innovativo flusso di lavoro su scala exascale finalizzato alla scoperta di materiali, che utilizza modelli grafici di fondazione atomistici basati su HydraGNN. Questo sistema innovativo è addestrato su 16 dataset di primi principi pubblicamente disponibili, comprendenti oltre 544 milioni di strutture attraverso più di 85 elementi. I ricercatori hanno implementato un'architettura multi-task, caratterizzata da testine per dataset e una pipeline di dati scalabile ADIOS2/DDStore, per condurre sei ampie campagne di ottimizzazione degli iperparametri DeepHyper in precisione FP64 sui supercomputer Frontier. I principali modelli di message-passing sono progrediti verso un addestramento sostenuto su 2.048 nodi, culminando in un modello basato su PaiNN. Questo modello facilita lo screening su scala miliardaria, valutando 1,1 miliardi di strutture atomiche in soli 50 secondi, riducendo significativamente il tempo necessario per il calcolo dei primi principi. Il flusso di lavoro consente anche il fine-tuning con dati limitati attraverso varie applicazioni downstream e dimostra trasferibilità attraverso dodici compiti chimicamente diversi. I ricercatori hanno valutato i compromessi precisione-prestazioni tra i formati BF16, FP32 e FP64, stabilendo nuovi standard nella scienza computazionale dei materiali. Questo flusso di lavoro segna un notevole balzo in avanti nell'high-performance computing per l'esplorazione scientifica.

Fatti principali

Il flusso di lavoro su scala exascale utilizza modelli grafici di fondazione atomistici costruiti su HydraGNN
Addestrato su 16 dataset aperti di primi principi con oltre 544 milioni di strutture che coprono più di 85 elementi
Architettura multi-task con testine per dataset e pipeline di dati scalabile ADIOS2/DDStore
Sei campagne su larga scala di ottimizzazione degli iperparametri DeepHyper eseguite in FP64 su Frontier
I modelli migliori promossi ad addestramento sostenuto su 2.048 nodi producendo il modello principale basato su PaiNN
Valuta 1,1 miliardi di strutture atomiche in 50 secondi
Comprime un carico di lavoro che richiederebbe anni di calcolo dei primi principi
Dimostra trasferibilità attraverso dodici compiti downstream chimicamente diversi

Entità

—

Fonti

arXiv cs.AI — 2026-04-20