COMPASS: Framework basato su VLM per il coordinamento multi-agente
COMPASS è un framework progettato per agenti multipli che incorpora modelli visione-linguaggio (VLM) per facilitare il processo decisionale decentralizzato a ciclo chiuso nell'ambito dell'apprendimento per rinforzo multi-agente cooperativo (MARL). Affronta le sfide legate all'efficienza del campionamento, all'interpretabilità e alla generalizzazione creando e migliorando dinamicamente strategie interpretabili basate su codice, conservate in una libreria di competenze sviluppata a partire da dimostrazioni di esperti. Il framework utilizza un protocollo di comunicazione strutturato multi-hop per condividere informazioni sulle entità, consentendo ai team di formare una comprensione coesa a partire da osservazioni incomplete. Testato sul benchmark SMACv2, COMPASS mostra notevoli progressi rispetto alle metodologie attuali.
Fatti principali
- COMPASS integra modelli visione-linguaggio (VLM) per il processo decisionale decentralizzato a ciclo chiuso.
- Genera e perfeziona dinamicamente strategie interpretabili basate su codice.
- Le strategie sono memorizzate in una libreria di competenze avviata da dimostrazioni di esperti.
- Un protocollo di comunicazione strutturato multi-hop propaga le informazioni sulle entità.
- Il framework è valutato sul benchmark SMACv2.
- COMPASS affronta l'efficienza del campionamento, l'interpretabilità e la generalizzazione in MARL.
- Supera le limitazioni dei LLM solo testuali e dei compiti non markoviani e parzialmente osservabili.
- Il framework consente ai team di costruire una comprensione coerente da osservazioni parziali.
Entità
Istituzioni
- arXiv