ARTFEED — Contemporary Art Intelligence

Attribuzione di Confidenza a Passi per Diagnosticare Fallimenti nel Ragionamento degli LLM

ai-technology · 2026-05-20

Un nuovo framework chiamato Attribuzione di Confidenza a Passi (SCA) diagnostica dove il ragionamento multi-step fallisce nei modelli linguistici di grandi dimensioni (LLM) a scatola nera, assegnando confidenza a ogni passo basandosi esclusivamente sulle tracce di ragionamento generate. SCA applica il principio del Collo di Bottiglia Informativo (IB): i passi che si allineano con il consenso tra soluzioni corrette ottengono alta confidenza, mentre le deviazioni vengono segnalate. Vengono proposti due metodi: NIBS (IB non parametrico senza strutture grafiche) e GIBS (IB basato su grafi che apprende sottografi tramite maschera differenziabile). L'approccio funziona per LLM closed-source senza accesso interno, superando le limitazioni dei metodi esistenti che stimano la confidenza solo per le risposte finali o richiedono accesso ai meccanismi interni.

Fatti principali

  • SCA diagnostica fallimenti nel ragionamento multi-step negli LLM a scatola nera
  • Assegna confidenza a livello di passo basandosi solo sulle tracce di ragionamento generate
  • Applica il principio del Collo di Bottiglia Informativo
  • I passi allineati con il consenso tra soluzioni corrette ricevono alta confidenza
  • Le deviazioni vengono segnalate come potenzialmente errate
  • Due metodi: NIBS (non parametrico) e GIBS (basato su grafi)
  • Funziona per LLM closed-source senza accesso ai meccanismi interni
  • I metodi esistenti sono limitati alle risposte finali o richiedono accesso interno

Entità

Istituzioni

  • arXiv

Fonti