Framework del Valore di Shapley per l'Equità nei Bandit Combinatoriali con Budget
Un nuovo articolo di ricerca propone un framework di equità meritocratica per bandit combinatoriali multi-braccio con budget e feedback completo (BCMAB-FBF). Gli autori estendono il valore di Shapley dalla teoria dei giochi cooperativi a un K-Shapley value, che misura i contributi marginali degli agenti limitati a insiemi di dimensione al massimo K. Dimostrano che il K-Shapley value soddisfa in modo unico le proprietà di simmetria, linearità, giocatore nullo ed efficienza. L'articolo introduce K-SVFair-FBF, un algoritmo bandit sensibile all'equità che stima adattivamente i K-Shapley values sotto funzioni di valutazione sconosciute, affrontando la sfida del feedback completo dove i contributi individuali dei bracci non sono direttamente osservati. Questo lavoro promuove l'equità nel processo decisionale sequenziale con vincoli di budget.
Fatti principali
- Il framework affronta l'equità meritocratica nei bandit combinatoriali multi-braccio con budget e feedback completo.
- Estende il valore di Shapley al K-Shapley value per contributi marginali con vincolo di dimensione K.
- Il K-Shapley value soddisfa le proprietà di simmetria, linearità, giocatore nullo ed efficienza.
- Propone l'algoritmo K-SVFair-FBF per la stima adattiva sotto funzioni di valutazione sconosciute.
- Il feedback completo rende la stima dei contributi più difficile rispetto al semi-bandit.
- L'articolo è un preprint arXiv 2605.00762.
- Si concentra sull'equità nel processo decisionale sequenziale con budget.
- L'algoritmo apprende la funzione di valutazione senza feedback esplicito a livello di braccio.
Entità
—