Protocollo di Comunicazione Basato su LLM Potenzia il RL Multi-Agente
I ricercatori propongono LMAC, un nuovo framework che utilizza il ragionamento di un LLM per progettare un protocollo di comunicazione per l'apprendimento per rinforzo cooperativo multi-agente. LMAC consente agli agenti di ricostruire lo stato sottostante in modo accurato e uniforme, perfezionando iterativamente il protocollo con un criterio esplicito di consapevolezza dello stato. Esperimenti su diversi benchmark MARL mostrano un miglioramento nella ricostruzione dello stato e guadagni sostanziali nelle prestazioni rispetto ai metodi precedenti.
Fatti principali
- LMAC sfrutta il ragionamento dell'LLM per progettare protocolli di comunicazione
- Il protocollo consente a tutti gli agenti di ricostruire lo stato sottostante
- Perfezionamento iterativo utilizzando un criterio di consapevolezza dello stato
- Esperimenti su diversi benchmark MARL
- Supera le baseline di comunicazione precedenti
Entità
—