Il framework FAX migliora l'affidabilità nei sistemi XAI agentici
Un nuovo framework chiamato Faithful Agentic XAI (FAX) mira a migliorare l'affidabilità delle spiegazioni prodotte da sistemi di intelligenza artificiale esplicativa agentici che utilizzano grandi modelli linguistici (LLM). Questi sistemi AI spesso generano spiegazioni apparentemente credibili ma inaffidabili, specialmente quando gli LLM amplificano output inaffidabili da modelli complessi. FAX affronta questo problema scomponendo le bozze di spiegazione in singole affermazioni e validandole rispetto a strumenti intrinsecamente affidabili, filtrando così le affermazioni non supportate o contraddittorie prima dell'output finale. Inoltre, i ricercatori hanno creato CRAFTER-XAI-Bench, un benchmark di apprendimento per rinforzo a mondo aperto che presenta politiche complesse, obiettivi vari e scenari impegnativi per valutare l'affidabilità specifica del modello. Utilizzando questo benchmark, FAX ha migliorato l'affidabilità della simulazione da 0,20 a un valore più alto non specificato. Questa ricerca è disponibile su arXiv con ID 2605.27879.
Fatti principali
- FAX sta per Faithful Agentic XAI
- FAX scompone le bozze di spiegazione in affermazioni
- Le affermazioni vengono verificate incrociate con strumenti intrinsecamente affidabili
- Le affermazioni non supportate o contraddittorie vengono filtrate
- CRAFTER-XAI-Bench è un benchmark di apprendimento per rinforzo a mondo aperto
- Il benchmark include politiche complesse, obiettivi diversi e scenari impegnativi
- FAX ha migliorato l'affidabilità della simulazione da 0,20 su CRAFTER-XAI-Bench
- L'articolo è su arXiv con ID 2605.27879
Entità
Istituzioni
- arXiv