Il framework STARS stabilizza le dinamiche ricorrenti nei modelli linguistici a loop

other · 2026-05-27

Un nuovo framework di addestramento chiamato STARS (STAbility-driven Recurrent Scaling) affronta l'instabilità dello scaling a tempo di test nei modelli linguistici a loop (LoopLM). I LoopLM utilizzano la ricorrenza in profondità per il ragionamento latente, ma spesso le prestazioni raggiungono un picco e poi crollano con ulteriori iterazioni. STARS vincola gli stati latenti ad avvicinarsi a punti fissi asintoticamente stabili tramite la regolarizzazione del raggio spettrale Jacobiano con campionamento casuale del loop. Esperimenti su compiti aritmetici mostrano che STARS ottiene uno scaling stabile ed efficace, consentendo catene di ragionamento più lunghe senza degradazione. Il lavoro concettualizza il ragionamento come riduzione dell'incertezza e mira alla convergenza verso punti fissi stabili.

Fatti principali

I LoopLM consentono un ragionamento latente efficiente attraverso la ricorrenza in profondità.
Le prestazioni nei LoopLM spesso raggiungono un picco a una certa profondità di iterazione e poi crollano.
STARS sta per STAbility-driven Recurrent Scaling.
STARS vincola gli stati latenti ad avvicinarsi a punti fissi asintoticamente stabili.
STARS utilizza la regolarizzazione del raggio spettrale Jacobiano con campionamento casuale del loop.
Il framework massimizza l'efficacia garantendo al contempo una rigorosa stabilità.
Gli esperimenti sono stati condotti su compiti aritmetici.
Il lavoro propone il ragionamento come riduzione dell'incertezza.

Entità

—

Fonti

arXiv cs.AI — 2026-05-27