HPML: Apprendimento Multi-Agente con Proiezione di Hodge per Aggiornamenti Stabili delle Politiche

other · 2026-05-20

È stato introdotto un approccio innovativo chiamato Hodge-Projected Multi-Agent Learning (HPML) per mitigare l'instabilità nei sistemi di apprendimento per rinforzo multi-agente. Proiettando i campi di aggiornamento congiunti su una componente metrica-gradiente, HPML analizza questi campi all'interno di uno spazio L² di campi vettoriali. Questa proiezione innovativa mira a identificare il flusso potenziale metrico-gradiente più vicino, indirizzando efficacemente gli aggiornamenti per ridurre le interazioni cicliche che possono compromettere la stabilità dell'apprendimento. HPML amplia le precedenti strategie di stabilizzazione, inclusi i metodi di regolarizzazione e consenso. I risultati completi sono disponibili nell'articolo di ricerca su arXiv con identificatore 2605.18809.

Fatti principali

arXiv:2605.18809v1
Tipo di annuncio: cross
L'apprendimento multi-agente a somma generale è governato da un campo di aggiornamento impilato
L'aggiornamento della politica di ogni agente modifica il panorama di ottimizzazione per gli altri
L'accoppiamento può intrecciare il miglioramento collettivo integrabile con dinamiche cicliche
Gli approcci esistenti includono metodi di regolarizzazione, assegnazione del credito e consenso
HPML sta per Hodge-Projected Multi-agent Learning
HPML calcola una proiezione di tipo Hodge sul flusso potenziale metrico-gradiente più vicino

HPML: Apprendimento Multi-Agente con Proiezione di Hodge per Aggiornamenti Stabili delle Politiche

Fatti principali

Entità

Istituzioni

Fonti