Escludere il dominio target migliora l'estrapolazione dell'IA nei modelli fisici
Un nuovo metodo di IA, il Deconfounded Hierarchical Gate (DHG), migliora l'estrapolazione in modelli generativi profondi vincolati dalla fisica affrontando variabili confondenti e vincoli fisici gerarchici. I ricercatori hanno scoperto che escludere i dati del dominio target durante il pre-addestramento supera l'inclusione degli stessi, un risultato controintuitivo che migliora le prestazioni fuori distribuzione. Il DHG utilizza la stima controfattuale e l'aggiustamento backdoor per rimuovere effetti spurii della temperatura, applicando vincoli progressivi dal generale al particolare. Questo lavoro è stato pubblicato su arXiv con ID 2605.07485.
Fatti principali
- L'articolo arXiv 2605.07485 introduce il Deconfounded Hierarchical Gate (DHG).
- DHG affronta il problema delle variabili confondenti nei modelli generativi vincolati dalla fisica.
- Escludere i dati del dominio target durante il pre-addestramento migliora l'estrapolazione.
- DHG utilizza la stima controfattuale tramite l'operatore do e l'aggiustamento backdoor.
- I vincoli fisici vengono applicati progressivamente dal generale al particolare.
- Il metodo identifica il confondimento della temperatura a ogni livello di vincolo.
- I gate gerarchici riflettono l'inconsistenza fisica intrinseca.
- Pubblicato come arXiv:2605.07485v1.
Entità
Istituzioni
- arXiv