Cicli LLM Ricorsivi: Studio Dose-Risposta del Reindirizzamento Persistente
Uno studio recente pubblicato su arXiv (2605.02236) esplora la quantità di testo iniettato necessaria per alterare cicli consolidati di modelli linguistici ricorsivi. I ricercatori hanno disaccoppiato il modello dalla regola di aggiornamento del contesto, esaminando aggiornamenti di tipo append, replace e dialog su cicli di 30 passi. Un risultato significativo rivela che nei cicli in modalità append, il reindirizzamento persistente è influenzato dalla politica di memoria. Con un clip di coda di 12.000 caratteri, la persistenza coerente con la destinazione si stabilizza intorno al 16%, mentre la fuga dal bacino di origine trattenuta raggiunge circa il 36% con una dose di 400, nessuna superando il 50%. Utilizzando un protocollo di cronologia completa, la fuga dal bacino di origine trattenuta supera il 50% vicino a 400 token e raggiunge il 75-80% entro 1.500 token, con la persistenza coerente con la destinazione che raggiunge per la prima volta 0,50 intorno a 1.500 token (Wilson 95% CI [0,41, 0,61]).
Fatti principali
- Studio su arXiv:2605.02236
- Cicli LLM ricorsivi testati con aggiornamenti append, replace e dialog
- Cicli ricorsivi di 30 passi utilizzati
- Il reindirizzamento persistente in modalità append è condizionato dalla politica di memoria
- Con clip di coda di 12.000 caratteri: persistenza coerente con la destinazione si stabilizza vicino al 16% con dose 400
- Con clip di coda: fuga dal bacino di origine trattenuta vicino al 36% con dose 400
- Con cronologia completa: fuga dal bacino di origine trattenuta supera il 50% vicino a 400 token
- Con cronologia completa: persistenza coerente con la destinazione raggiunge 0,50 vicino a 1.500 token
Entità
Istituzioni
- arXiv