COMPASS: Framework basato su VLM per il coordinamento multi-agente

ai-technology · 2026-05-07

COMPASS è un framework progettato per agenti multipli che incorpora modelli visione-linguaggio (VLM) per facilitare il processo decisionale decentralizzato a ciclo chiuso nell'ambito dell'apprendimento per rinforzo multi-agente cooperativo (MARL). Affronta le sfide legate all'efficienza del campionamento, all'interpretabilità e alla generalizzazione creando e migliorando dinamicamente strategie interpretabili basate su codice, conservate in una libreria di competenze sviluppata a partire da dimostrazioni di esperti. Il framework utilizza un protocollo di comunicazione strutturato multi-hop per condividere informazioni sulle entità, consentendo ai team di formare una comprensione coesa a partire da osservazioni incomplete. Testato sul benchmark SMACv2, COMPASS mostra notevoli progressi rispetto alle metodologie attuali.

Fatti principali

COMPASS integra modelli visione-linguaggio (VLM) per il processo decisionale decentralizzato a ciclo chiuso.
Genera e perfeziona dinamicamente strategie interpretabili basate su codice.
Le strategie sono memorizzate in una libreria di competenze avviata da dimostrazioni di esperti.
Un protocollo di comunicazione strutturato multi-hop propaga le informazioni sulle entità.
Il framework è valutato sul benchmark SMACv2.
COMPASS affronta l'efficienza del campionamento, l'interpretabilità e la generalizzazione in MARL.
Supera le limitazioni dei LLM solo testuali e dei compiti non markoviani e parzialmente osservabili.
Il framework consente ai team di costruire una comprensione coerente da osservazioni parziali.

COMPASS: Framework basato su VLM per il coordinamento multi-agente

Fatti principali

Entità

Istituzioni

Fonti