ARTFEED — Contemporary Art Intelligence

CoFlow: Coordinazione Multi-Agente a Poochi Passi tramite Campo di Velocità Congiunto

other · 2026-05-06

Un innovativo framework generativo per l'apprendimento per rinforzo multi-agente offline consente un'inferenza coordinata a pochi passi mantenendo la collaborazione tra agenti. L'architettura CoFlow integra Coordinated Velocity Attention (CVA) e Adaptive Coordination Gating, utilizzando un surrogato di consistenza alle differenze finite per bypassare la retropropagazione del prodotto Jacobiano-vettore, che richiede molta memoria. Valutato su 60 configurazioni negli ambienti MPE, MA-MuJoCo e SMAC, CoFlow mostra che la generazione multi-agente a passaggio singolo può mantenere la coordinazione anche quando il campo di velocità è intrinsecamente accoppiato, contraddicendo le precedenti convinzioni secondo cui politiche indipendenti per agente sono necessarie per l'inferenza a pochi passi.

Fatti principali

  • CoFlow è un modello generativo per l'apprendimento per rinforzo multi-agente offline.
  • Consente un'inferenza coordinata a pochi passi senza sacrificare la coordinazione tra agenti.
  • L'architettura utilizza Coordinated Velocity Attention (CVA) e Adaptive Coordination Gating.
  • Un surrogato di consistenza alle differenze finite sostituisce la retropropagazione del prodotto Jacobiano-vettore.
  • Testato su 60 configurazioni negli ambienti MPE, MA-MuJoCo e SMAC.
  • Gli approcci precedenti richiedevano molti passi di campionamento iterativi o politiche indipendenti per agente.
  • CoFlow mostra che la generazione multi-agente a passaggio singolo può preservare la coordinazione con un campo di velocità congiunto accoppiato.
  • L'articolo è pubblicato su arXiv con ID 2605.01457.

Entità

Istituzioni

  • arXiv

Fonti