GSAR: Un Framework di Grounding Tipizzato per la Rilevazione di Allucinazioni in Sistemi Multi-Agente LLM
Un nuovo framework chiamato GSAR (Groundedness Scoring And Replanning) affronta il problema delle allucinazioni nei sistemi multi-agente LLM introducendo una tipologia a quattro vie per le affermazioni: fondate, infondate, contraddette e complementari. A differenza dei valutatori binari o scalari esistenti, GSAR assegna pesi specifici per tipo di evidenza che riflettono la forza epistemica e calcola un punteggio di fondatezza ponderato asimmetricamente penalizzato per le contraddizioni. Questo punteggio alimenta una funzione decisionale a tre livelli per azioni a valle. Il framework tratta le prospettive alternative non ridondanti come evidenza di prima classe. L'articolo è pubblicato su arXiv con ID 2604.23366.
Fatti principali
- GSAR suddivide le affermazioni in tipi: fondate, infondate, contraddette e complementari.
- Assegna pesi specifici per tipo di evidenza che riflettono la forza epistemica.
- Calcola un punteggio di fondatezza ponderato asimmetricamente penalizzato per le contraddizioni.
- Il punteggio è accoppiato a una funzione decisionale a tre livelli.
- Il framework è progettato per sistemi multi-agente LLM autonomi che indagano incidenti operativi.
- Ha lo scopo di garantire che le affermazioni siano fondate su evidenze osservate piuttosto che su inferenze interne al modello.
- I metodi esistenti trattano le evidenze di supporto come intercambiabili ed emettono un singolo segnale.
- L'articolo è disponibile su arXiv con ID 2604.23366.
Entità
Istituzioni
- arXiv