Modello di Riavvio Contaminato dal Contesto per i Fallimenti degli Agenti LLM

ai-technology · 2026-05-12

Il Modello di Riavvio Contaminato dal Contesto (CCRM) è un nuovo quadro formale che affronta il problema degli agenti LLM che lottano con compiti multi-step che utilizzano strumenti. Quando questi agenti tentano un compito e falliscono, portano il fallimento nella loro finestra di contesto, il che influisce negativamente sui tentativi successivi e aumenta i tassi di errore oltre la linea di base. Il modello delinea una sequenza di T passi di chiamate a strumenti, ciascuno fallendo con un tasso base di epsilon_0; dopo un fallimento, il passo successivo opera sotto un contesto contaminato con un tasso di errore più alto epsilon_1 > epsilon_0. L'articolo presenta cinque risultati chiave: una formula precisa per la probabilità di successo entro K tentativi, un teorema di cascata-overhead che misura i tentativi extra Delta K dovuti alla contaminazione, e un teorema di allocazione ottimale del budget che determina la profondità della pipeline T* per massimizzare la probabilità di successo. Questa ricerca, disponibile su arXiv con ID 2605.08563, è la prima analisi formale di questo problema comunemente osservato ma precedentemente non formalizzato.

Fatti principali

ID arXiv: 2605.08563
Tipo di annuncio: nuovo
CCRM sta per Modello di Riavvio Contaminato dal Contesto
Tasso di errore base: epsilon_0
Tasso di errore contaminato: epsilon_1 > epsilon_0
T è il numero di passi di chiamate a strumenti
K è il numero di tentativi
Cinque risultati principali derivati: probabilità di successo in forma chiusa, teorema di cascata-overhead, teorema di allocazione ottimale del budget

Modello di Riavvio Contaminato dal Contesto per i Fallimenti degli Agenti LLM

Fatti principali

Entità

Istituzioni

Fonti