Il framework AdaFair-MARL impone equità adattiva nell'apprendimento multi-agente
I ricercatori propongono AdaFair-MARL, un framework di apprendimento per rinforzo multi-agente cooperativo vincolato che impone l'equità del carico di lavoro come vincolo esplicito. A differenza di penalità fisse o modellazione euristica delle ricompense, AdaFair-MARL utilizza un aggiornamento primale-duale per mantenere contributi bilanciati degli agenti ottimizzando le prestazioni del team. L'approccio affronta l'instabilità dell'addestramento e gli incentivi contrastanti in sistemi multi-agente eterogenei. L'articolo è disponibile su arXiv con identificatore 2511.14135.
Fatti principali
- AdaFair-MARL formula l'equità del carico di lavoro come vincolo esplicito.
- Il componente algoritmico principale è un aggiornamento primale-duale.
- Si rivolge a sistemi multi-agente eterogenei con obiettivi condivisi.
- Supera i limiti delle penalità fisse di equità e della modellazione euristica delle ricompense.
- Pubblicato su arXiv con ID 2511.14135.
- Tipo di annuncio: replace-cross.
Entità
Istituzioni
- arXiv