ARTFEED — Contemporary Art Intelligence

Framework del Valore di Shapley per l'Equità nei Bandit Combinatoriali con Budget

other · 2026-05-04

Un nuovo articolo di ricerca propone un framework di equità meritocratica per bandit combinatoriali multi-braccio con budget e feedback completo (BCMAB-FBF). Gli autori estendono il valore di Shapley dalla teoria dei giochi cooperativi a un K-Shapley value, che misura i contributi marginali degli agenti limitati a insiemi di dimensione al massimo K. Dimostrano che il K-Shapley value soddisfa in modo unico le proprietà di simmetria, linearità, giocatore nullo ed efficienza. L'articolo introduce K-SVFair-FBF, un algoritmo bandit sensibile all'equità che stima adattivamente i K-Shapley values sotto funzioni di valutazione sconosciute, affrontando la sfida del feedback completo dove i contributi individuali dei bracci non sono direttamente osservati. Questo lavoro promuove l'equità nel processo decisionale sequenziale con vincoli di budget.

Fatti principali

  • Il framework affronta l'equità meritocratica nei bandit combinatoriali multi-braccio con budget e feedback completo.
  • Estende il valore di Shapley al K-Shapley value per contributi marginali con vincolo di dimensione K.
  • Il K-Shapley value soddisfa le proprietà di simmetria, linearità, giocatore nullo ed efficienza.
  • Propone l'algoritmo K-SVFair-FBF per la stima adattiva sotto funzioni di valutazione sconosciute.
  • Il feedback completo rende la stima dei contributi più difficile rispetto al semi-bandit.
  • L'articolo è un preprint arXiv 2605.00762.
  • Si concentra sull'equità nel processo decisionale sequenziale con budget.
  • L'algoritmo apprende la funzione di valutazione senza feedback esplicito a livello di braccio.

Entità

Fonti