HIBCG: Grafi di Coordinamento con Collo di Bottiglia Informazionale per l'Apprendimento per Rinforzo Multi-Agente
Uno studio recente pubblicato su arXiv introduce i Grafi di Coordinamento con Collo di Bottiglia Informazionale Eterogeneo (HIBCG) volti a migliorare l'apprendimento per rinforzo cooperativo multi-agente. Questo approccio utilizza il collo di bottiglia informazionale di grafo (GIB) per stabilire un grafo di coordinamento sparso, dove sia la presenza degli archi che la capacità dei messaggi sono supportate da basi teoriche. HIBCG formula un prior a blocchi diagonali allineato ai gruppi che offre un criterio chiaro per la conservazione degli archi, specificando quali archi devono essere mantenuti e la loro densità all'interno di ciascun gruppo. Questa innovazione affronta le carenze degli attuali apprendisti di grafi sparsi, che spesso dipendono da metodi euristici privi di garanzie formali riguardo alla topologia e alla distribuzione della capacità di comunicazione.
Fatti principali
- Titolo dell'articolo: Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning
- ID arXiv: 2605.17393
- Tipo di annuncio: nuovo
- Propone HIBCG (Grafi di Coordinamento con Collo di Bottiglia Informazionale Eterogeneo)
- Utilizza il collo di bottiglia informazionale di grafo (GIB) come strumento di base
- Costruisce un prior a blocchi diagonali allineato ai gruppi per la conservazione degli archi
- Fornisce un criterio in forma chiusa per l'esistenza e la densità degli archi
- Affronta la mancanza di basi teoriche negli attuali apprendisti di grafi sparsi
Entità
Istituzioni
- arXiv