CoFlow: Coordinazione Multi-Agente a Poochi Passi tramite Campo di Velocità Congiunto
Un innovativo framework generativo per l'apprendimento per rinforzo multi-agente offline consente un'inferenza coordinata a pochi passi mantenendo la collaborazione tra agenti. L'architettura CoFlow integra Coordinated Velocity Attention (CVA) e Adaptive Coordination Gating, utilizzando un surrogato di consistenza alle differenze finite per bypassare la retropropagazione del prodotto Jacobiano-vettore, che richiede molta memoria. Valutato su 60 configurazioni negli ambienti MPE, MA-MuJoCo e SMAC, CoFlow mostra che la generazione multi-agente a passaggio singolo può mantenere la coordinazione anche quando il campo di velocità è intrinsecamente accoppiato, contraddicendo le precedenti convinzioni secondo cui politiche indipendenti per agente sono necessarie per l'inferenza a pochi passi.
Fatti principali
- CoFlow è un modello generativo per l'apprendimento per rinforzo multi-agente offline.
- Consente un'inferenza coordinata a pochi passi senza sacrificare la coordinazione tra agenti.
- L'architettura utilizza Coordinated Velocity Attention (CVA) e Adaptive Coordination Gating.
- Un surrogato di consistenza alle differenze finite sostituisce la retropropagazione del prodotto Jacobiano-vettore.
- Testato su 60 configurazioni negli ambienti MPE, MA-MuJoCo e SMAC.
- Gli approcci precedenti richiedevano molti passi di campionamento iterativi o politiche indipendenti per agente.
- CoFlow mostra che la generazione multi-agente a passaggio singolo può preservare la coordinazione con un campo di velocità congiunto accoppiato.
- L'articolo è pubblicato su arXiv con ID 2605.01457.
Entità
Istituzioni
- arXiv