ReacTOD: NLU Neuro-Simbolica Vincolata per il Tracciamento dello Stato del Dialogo Zero-Shot
ReacTOD è un framework neuro-simbolico vincolato progettato per sistemi di dialogo orientati ai compiti, che reinterpreta la comprensione del linguaggio naturale come invocazioni di strumenti distinti all'interno di un ciclo ReAct auto-correttivo basato su validazione deterministica. Questo sistema affronta problemi come allucinazioni ed errori di formattazione riscontrati in LLM di dimensioni moderate, che possono portare ad azioni errate, come prenotare un hotel in una data sbagliata. Utilizzando un ciclo ReAct vincolato, migliora l'accuratezza fino a 9,3 punti percentuali rispetto all'inferenza a passaggio singolo sul benchmark MultiWOZ. Un validatore simbolico garantisce che ogni aggiornamento dello stato del dialogo rispetti la conformità delle azioni, l'aderenza allo schema e la coerenza dei coreferenti, raggiungendo un tasso di auto-correzione del 93,1% sugli errori identificati e generando tracce di esecuzione strutturate. L'articolo è disponibile su arXiv con riferimento 2605.19077.
Fatti principali
- 1. ReacTOD è un'architettura neuro-simbolica vincolata per sistemi di dialogo orientati ai compiti.
- 2. Riformula la NLU come chiamate a strumenti discreti all'interno di un ciclo ReAct auto-correttivo.
- 3. Il sistema migliora l'accuratezza fino a 9,3 punti percentuali rispetto all'inferenza a passaggio singolo su MultiWOZ.
- 4. Un validatore simbolico impone la conformità delle azioni, l'aderenza allo schema e la coerenza dei coreferenti.
- 5. Raggiunge un tasso di auto-correzione del 93,1% sugli errori intercettati.
- 6. La previsione incrementale dello stato e il recupero su richiesta della cronologia mantengono i prompt compatti.
- 7. L'articolo è disponibile su arXiv con riferimento 2605.19077.
Entità
Istituzioni
- arXiv