ARTFEED — Contemporary Art Intelligence

Moonwalk: Differenziazione Inversa-Forward

ai-technology · 2026-05-25

Un nuovo articolo su arXiv propone Moonwalk, un metodo per eliminare la necessità di memorizzare le attivazioni intermedie durante l'addestramento delle reti neurali. Il collo di bottiglia della memoria nella backpropagation deriva dal salvare i residui nel forward pass. Gli autori definiscono reti sommerse con cokernel Jacobiani banali, consentendo una ricostruzione esatta del gradiente senza attivazioni memorizzate. Per i livelli non sommersi, il fragmental gradient checkpointing registra solo residui minimi per ripristinare i cotangenti persi. L'innovazione chiave è l'operatore vettore-inverso. Questo lavoro affronta una limitazione fondamentale nell'addestramento di reti profonde.

Fatti principali

  • Titolo dell'articolo: Moonwalk: Inverse-Forward Differentiation
  • ID arXiv: 2402.14212
  • Tipo di annuncio: replace-cross
  • Affronta la necessità della backpropagation di memorizzare le attivazioni intermedie
  • Definisce reti sommerse con cokernel Jacobiani banali
  • Introduce il fragmental gradient checkpointing per livelli non sommersi
  • Operatore innovativo: vettore-inverso
  • Mira a consentire l'addestramento di reti più profonde senza overhead di memoria

Entità

Istituzioni

  • arXiv

Fonti