Il Norm-Anchor Scaling Previene il Collasso della Modifica dei Modelli
È stata scoperta una modalità di fallimento nel processo sequenziale di modifica dei modelli locate-and-edit (L&E), caratterizzata come un ciclo di feedback positivo della norma che causa un'amplificazione tra i vettori di valore risolti e i pesi MLP aggiustati, portando infine a un declino della qualità della modifica e a una perdita di capacità. Per affrontare questo problema, i ricercatori hanno introdotto il Norm-Anchor Scaling (NAS), un plug-in stabilizzante che ridimensiona ogni vettore di valore risolto per allinearlo alla norma di riferimento del modello originale. Implementato su vari backbone LLM, dataset e editor L&E, il NAS aumenta l'intervallo di modifica effettivo di oltre 4 volte e migliora le prestazioni di modifica a lungo termine in media del 72,2%, il tutto con una modifica di una singola riga e un costo computazionale minimo.
Fatti principali
- 1. La modifica sequenziale dei modelli L&E può fallire bruscamente dopo molte modifiche.
- 2. Il fallimento è causato da un ciclo di feedback positivo della norma.
- 3. Il ciclo coinvolge vettori di valore risolti e pesi MLP modificati.
- 4. La crescita della norma sotto la dinamica L&E standard è approssimativamente esponenziale.
- 5. I regolarizzatori esistenti o i blocchi di aggiornamento non risolvono il problema.
- 6. Il NAS interrompe il ciclo ridimensionando i vettori di valore alla norma di riferimento del modello originale.
- 7. Il NAS estende l'orizzonte di modifica di oltre 4 volte.
- 8. Il NAS migliora le prestazioni di modifica a lungo termine in media del 72,2%.
Entità
—