Comunicazione a Banda Limitata nel MARL
Un nuovo articolo su arXiv presenta SLIM, un'architettura minima per l'apprendimento per rinforzo multi-agente (MARL) che disaccoppia la comunicazione dalla rappresentazione della politica sotto vincoli di banda. Gli autori propongono un budget di banda normalizzato per agente β per unificare sparsità, round e dimensione del messaggio. Questo affronta il degrado delle prestazioni in applicazioni come sciami di droni per ricerca e soccorso, dove la riduzione della dimensione del messaggio limita la capacità della politica. Il lavoro proviene da arXiv:2605.21085.
Fatti principali
- arXiv:2605.21085
- L'architettura SLIM disaccoppia la comunicazione dallo spazio latente della politica
- β è un budget di banda normalizzato per agente
- Affronta i vincoli di banda nel MARL
- Applicazione: ricerca e soccorso con sciami di droni
- Il collo di bottiglia accoppiato nella rappresentazione latente condivisa causa perdita di prestazioni
- Ridurre la dimensione del messaggio limita la capacità della politica
- Viene menzionata la co-ottimizzazione in-step
Entità
Istituzioni
- arXiv