ARTFEED — Contemporary Art Intelligence

Calibrazione della Fiducia per l'Uso di Strumenti AI Formalizzata come Apprendimento delle Preferenze

ai-technology · 2026-05-20

Un recente studio pubblicato su arXiv definisce la calibrazione della fiducia nel contesto dell'uso di strumenti agentivi come un problema di apprendimento delle preferenze. Gli autori introducono un gateway di policy che mantiene un posteriore basato su processi gaussiani che riflette una funzione latente di tolleranza al rischio umano, misurata attraverso feedback binari di approvazione o rifiuto. Il sistema richiede il consenso umano proprio quando l'esito è più ambiguo. Questo approccio esemplifica l'Ottimizzazione Bayesiana Preferenziale, utilizzando il suo framework inferenziale e l'efficienza nel campionamento, ma diverge nell'obiettivo: categorizzare uno spazio di azioni in zone di permesso/blocco/richiesta invece di ottimizzare un progetto. Il lavoro rientra nella categoria Computer Science > Artificial Intelligence.

Fatti principali

  • Formalizza la calibrazione della fiducia per l'uso di strumenti agentivi come apprendimento delle preferenze
  • Il gateway di policy utilizza un posteriore basato su processi gaussiani sulla tolleranza al rischio umano
  • Osserva feedback binari di approvazione/rifiuto tramite verosimiglianza probit
  • Si rivolge all'umano dove l'esito di approvazione è più incerto
  • Strutturalmente è un'istanza di Ottimizzazione Bayesiana Preferenziale
  • Eredita la classificazione approssimata basata su processi gaussiani e l'interrogazione mirata all'incertezza
  • L'obiettivo è classificare lo spazio delle azioni in regioni di permesso/blocco/richiesta
  • L'articolo è su arXiv sotto Computer Science > Artificial Intelligence

Entità

Istituzioni

  • arXiv

Fonti