TraceFix: Verifica TLA+ per il Coordinamento Multi-Agente di LLM

ai-technology · 2026-05-11

I ricercatori hanno introdotto TraceFix, una pipeline incentrata sulla verifica progettata per il coordinamento di modelli linguistici di grandi dimensioni (LLM) multi-agente. Un agente inizia creando una rappresentazione intermedia strutturata (IR) da una descrizione del compito, che porta alla generazione della logica di coordinamento PlusCal. Il protocollo viene quindi perfezionato iterativamente utilizzando controesempi dal model checker TLA+ (TLC) fino a quando non viene verificato. I corpi di processo verificati vengono trasformati in prompt di sistema per ciascun agente e monitorati a runtime per prevenire azioni di coordinamento fuori topologia. Su 48 compiti che coprono 16 famiglie di scenari, tutti i compiti raggiungono una verifica TLC completa; il 62,5% ha successo al primo tentativo, con non più di quattro iterazioni di riparazione necessarie. Nonostante gli spazi degli stati varino di sei ordini di grandezza, la verifica viene completata in meno di 60 secondi per ogni compito. Un confronto runtime che coinvolge 3.456 esecuzioni indica che l'esecuzione monitorata dalla topologia produce i tassi di completamento dei compiti più elevati, con una media dell'89,4% e l'81,5% che raggiunge il completamento totale.

Fatti principali

TraceFix è una pipeline incentrata sulla verifica per il coordinamento multi-agente di LLM.
Utilizza il model checker TLA+ (TLC) per verificare la logica di coordinamento PlusCal.
Il 62,5% dei compiti supera la verifica al primo tentativo.
Nessun compito richiede più di quattro iterazioni di riparazione.
La verifica viene completata in meno di 60 secondi per tutti i compiti.
L'esecuzione monitorata dalla topologia raggiunge una media di completamento dei compiti dell'89,4%.
Il tasso di completamento totale dei compiti è dell'81,5%.
La pipeline è stata testata su 48 compiti in 16 famiglie di scenari.

Entità

—

Fonti

arXiv cs.AI — 2026-05-11