Vector Network: Una Nuova Architettura per l'Apprendimento Composizionale
Un nuovo framework ricorrente gerarchico chiamato Vector Network (VN) è stato sviluppato dai ricercatori, che sostituisce le matrici di peso fisse nei modelli di deep learning con collezioni di atomi di peso riutilizzabili di rango 1. Per ogni input, VN ottimizza un'energia specifica del layer per determinare una selezione sparsa di atomi di peso attivi e i loro coefficienti corrispondenti, rispettando i vincoli di ricostruzione dell'input dal basso verso l'alto e di coerenza del feedback dall'alto verso il basso. Questi coefficienti formano una matrice di peso a basso rango adattata all'input. Dopo la convergenza, solo gli atomi di peso selezionati vengono aggiornati tramite apprendimento lento, utilizzando segnali residui locali regolati dai coefficienti inferiti. Il VN è stato testato su quattro benchmark composizionali che coinvolgono segnali 1D e dati 2D. L'articolo è disponibile su arXiv con l'identificatore 2605.28007.
Fatti principali
- Vector Network (VN) è un'architettura ricorrente gerarchica.
- Ogni layer ha una libreria di atomi di peso riutilizzabili di rango 1.
- VN minimizza un'energia locale del layer per inferire atomi di peso attivi e coefficienti.
- I vincoli includono la ricostruzione dell'input dal basso verso l'alto e la coerenza del feedback dall'alto verso il basso.
- I coefficienti inferiti compongono una matrice di peso a basso rango specifica per l'input.
- L'apprendimento lento aggiorna solo gli atomi di peso selezionati.
- Gli aggiornamenti utilizzano segnali residui locali scalati dai coefficienti inferiti.
- Valutato su quattro benchmark composizionali (segnali 1D, dati 2D).
Entità
Istituzioni
- arXiv