Il Norm-Anchor Scaling Previene il Collasso della Modifica dei Modelli

ai-technology · 2026-05-07

È stata scoperta una modalità di fallimento nel processo sequenziale di modifica dei modelli locate-and-edit (L&E), caratterizzata come un ciclo di feedback positivo della norma che causa un'amplificazione tra i vettori di valore risolti e i pesi MLP aggiustati, portando infine a un declino della qualità della modifica e a una perdita di capacità. Per affrontare questo problema, i ricercatori hanno introdotto il Norm-Anchor Scaling (NAS), un plug-in stabilizzante che ridimensiona ogni vettore di valore risolto per allinearlo alla norma di riferimento del modello originale. Implementato su vari backbone LLM, dataset e editor L&E, il NAS aumenta l'intervallo di modifica effettivo di oltre 4 volte e migliora le prestazioni di modifica a lungo termine in media del 72,2%, il tutto con una modifica di una singola riga e un costo computazionale minimo.

Fatti principali

1. La modifica sequenziale dei modelli L&E può fallire bruscamente dopo molte modifiche.
2. Il fallimento è causato da un ciclo di feedback positivo della norma.
3. Il ciclo coinvolge vettori di valore risolti e pesi MLP modificati.
4. La crescita della norma sotto la dinamica L&E standard è approssimativamente esponenziale.
5. I regolarizzatori esistenti o i blocchi di aggiornamento non risolvono il problema.
6. Il NAS interrompe il ciclo ridimensionando i vettori di valore alla norma di riferimento del modello originale.
7. Il NAS estende l'orizzonte di modifica di oltre 4 volte.
8. Il NAS migliora le prestazioni di modifica a lungo termine in media del 72,2%.

Entità

—

Fonti

arXiv cs.AI — 2026-05-07