ARTFEED — Contemporary Art Intelligence

GSAR: Un Framework di Grounding Tipizzato per la Rilevazione di Allucinazioni in Sistemi Multi-Agente LLM

ai-technology · 2026-04-29

Un nuovo framework chiamato GSAR (Groundedness Scoring And Replanning) affronta il problema delle allucinazioni nei sistemi multi-agente LLM introducendo una tipologia a quattro vie per le affermazioni: fondate, infondate, contraddette e complementari. A differenza dei valutatori binari o scalari esistenti, GSAR assegna pesi specifici per tipo di evidenza che riflettono la forza epistemica e calcola un punteggio di fondatezza ponderato asimmetricamente penalizzato per le contraddizioni. Questo punteggio alimenta una funzione decisionale a tre livelli per azioni a valle. Il framework tratta le prospettive alternative non ridondanti come evidenza di prima classe. L'articolo è pubblicato su arXiv con ID 2604.23366.

Fatti principali

  • GSAR suddivide le affermazioni in tipi: fondate, infondate, contraddette e complementari.
  • Assegna pesi specifici per tipo di evidenza che riflettono la forza epistemica.
  • Calcola un punteggio di fondatezza ponderato asimmetricamente penalizzato per le contraddizioni.
  • Il punteggio è accoppiato a una funzione decisionale a tre livelli.
  • Il framework è progettato per sistemi multi-agente LLM autonomi che indagano incidenti operativi.
  • Ha lo scopo di garantire che le affermazioni siano fondate su evidenze osservate piuttosto che su inferenze interne al modello.
  • I metodi esistenti trattano le evidenze di supporto come intercambiabili ed emettono un singolo segnale.
  • L'articolo è disponibile su arXiv con ID 2604.23366.

Entità

Istituzioni

  • arXiv

Fonti