HPML: Apprendimento Multi-Agente con Proiezione di Hodge per Aggiornamenti Stabili delle Politiche
È stato introdotto un approccio innovativo chiamato Hodge-Projected Multi-Agent Learning (HPML) per mitigare l'instabilità nei sistemi di apprendimento per rinforzo multi-agente. Proiettando i campi di aggiornamento congiunti su una componente metrica-gradiente, HPML analizza questi campi all'interno di uno spazio L² di campi vettoriali. Questa proiezione innovativa mira a identificare il flusso potenziale metrico-gradiente più vicino, indirizzando efficacemente gli aggiornamenti per ridurre le interazioni cicliche che possono compromettere la stabilità dell'apprendimento. HPML amplia le precedenti strategie di stabilizzazione, inclusi i metodi di regolarizzazione e consenso. I risultati completi sono disponibili nell'articolo di ricerca su arXiv con identificatore 2605.18809.
Fatti principali
- arXiv:2605.18809v1
- Tipo di annuncio: cross
- L'apprendimento multi-agente a somma generale è governato da un campo di aggiornamento impilato
- L'aggiornamento della politica di ogni agente modifica il panorama di ottimizzazione per gli altri
- L'accoppiamento può intrecciare il miglioramento collettivo integrabile con dinamiche cicliche
- Gli approcci esistenti includono metodi di regolarizzazione, assegnazione del credito e consenso
- HPML sta per Hodge-Projected Multi-agent Learning
- HPML calcola una proiezione di tipo Hodge sul flusso potenziale metrico-gradiente più vicino
Entità
Istituzioni
- arXiv