Framework di Addestramento a Precisione Mista per Neural ODE
È stato proposto un nuovo framework di addestramento a precisione mista per equazioni differenziali ordinarie neurali (Neural ODE). Il framework utilizza calcoli a bassa precisione per valutare la velocità parametrizzata dalla rete neurale e per memorizzare valori intermedi, mantenendo i pesi in alta precisione. Incorpora risolutori ODE espliciti e uno schema di backpropagation personalizzato. L'approccio mira a ridurre i costi computazionali e l'uso della memoria senza sacrificare l'accuratezza. Esperimenti su vari compiti di apprendimento dimostrano la sua efficacia. Il lavoro affronta la sfida di applicare la precisione mista alle architetture a tempo continuo, che in precedenza soffrivano di errori di arrotondamento e instabilità.
Fatti principali
- Proposto framework di addestramento a precisione mista per Neural ODE
- Calcoli a bassa precisione per la valutazione della velocità e la memorizzazione intermedia
- Pesi mantenuti in alta precisione
- Utilizzo di risolutori ODE espliciti e backpropagation personalizzata
- Riduce costi computazionali e uso della memoria
- Efficace su una gamma di compiti di apprendimento
- Affronta errori di arrotondamento e instabilità nelle architetture a tempo continuo
- Pubblicato su arXiv: 2510.23498v2
Entità
Istituzioni
- arXiv