ARTFEED — Contemporary Art Intelligence

HPML: Apprendimento Multi-Agente con Proiezione di Hodge per Aggiornamenti Stabili delle Politiche

other · 2026-05-20

È stato introdotto un approccio innovativo chiamato Hodge-Projected Multi-Agent Learning (HPML) per mitigare l'instabilità nei sistemi di apprendimento per rinforzo multi-agente. Proiettando i campi di aggiornamento congiunti su una componente metrica-gradiente, HPML analizza questi campi all'interno di uno spazio L² di campi vettoriali. Questa proiezione innovativa mira a identificare il flusso potenziale metrico-gradiente più vicino, indirizzando efficacemente gli aggiornamenti per ridurre le interazioni cicliche che possono compromettere la stabilità dell'apprendimento. HPML amplia le precedenti strategie di stabilizzazione, inclusi i metodi di regolarizzazione e consenso. I risultati completi sono disponibili nell'articolo di ricerca su arXiv con identificatore 2605.18809.

Fatti principali

  • arXiv:2605.18809v1
  • Tipo di annuncio: cross
  • L'apprendimento multi-agente a somma generale è governato da un campo di aggiornamento impilato
  • L'aggiornamento della politica di ogni agente modifica il panorama di ottimizzazione per gli altri
  • L'accoppiamento può intrecciare il miglioramento collettivo integrabile con dinamiche cicliche
  • Gli approcci esistenti includono metodi di regolarizzazione, assegnazione del credito e consenso
  • HPML sta per Hodge-Projected Multi-agent Learning
  • HPML calcola una proiezione di tipo Hodge sul flusso potenziale metrico-gradiente più vicino

Entità

Istituzioni

  • arXiv

Fonti