Calibrazione della Fiducia per l'Uso di Strumenti AI Formalizzata come Apprendimento delle Preferenze

ai-technology · 2026-05-20

Un recente studio pubblicato su arXiv definisce la calibrazione della fiducia nel contesto dell'uso di strumenti agentivi come un problema di apprendimento delle preferenze. Gli autori introducono un gateway di policy che mantiene un posteriore basato su processi gaussiani che riflette una funzione latente di tolleranza al rischio umano, misurata attraverso feedback binari di approvazione o rifiuto. Il sistema richiede il consenso umano proprio quando l'esito è più ambiguo. Questo approccio esemplifica l'Ottimizzazione Bayesiana Preferenziale, utilizzando il suo framework inferenziale e l'efficienza nel campionamento, ma diverge nell'obiettivo: categorizzare uno spazio di azioni in zone di permesso/blocco/richiesta invece di ottimizzare un progetto. Il lavoro rientra nella categoria Computer Science > Artificial Intelligence.

Fatti principali

Formalizza la calibrazione della fiducia per l'uso di strumenti agentivi come apprendimento delle preferenze
Il gateway di policy utilizza un posteriore basato su processi gaussiani sulla tolleranza al rischio umano
Osserva feedback binari di approvazione/rifiuto tramite verosimiglianza probit
Si rivolge all'umano dove l'esito di approvazione è più incerto
Strutturalmente è un'istanza di Ottimizzazione Bayesiana Preferenziale
Eredita la classificazione approssimata basata su processi gaussiani e l'interrogazione mirata all'incertezza
L'obiettivo è classificare lo spazio delle azioni in regioni di permesso/blocco/richiesta
L'articolo è su arXiv sotto Computer Science > Artificial Intelligence

Calibrazione della Fiducia per l'Uso di Strumenti AI Formalizzata come Apprendimento delle Preferenze

Fatti principali

Entità

Istituzioni

Fonti