MetaAgent-X: Apprendimento per Rinforzo End-to-End per Sistemi Multi-Agente
MetaAgent-X, un nuovo framework di IA, introduce l'apprendimento per rinforzo end-to-end specificamente progettato per sistemi multi-agente automatici. A differenza dei metodi precedenti che si basano su ricerche senza addestramento durante il test o che migliorano solo il progettista a livello meta lasciando gli agenti esecutori inattivi, MetaAgent-X perfeziona simultaneamente sia i processi di progettazione che di esecuzione. Questo framework facilita la generazione di MAS basati su script, la raccolta di dati di rollout dell'esecuzione e la distribuzione del credito per le traiettorie del progettista e dell'esecutore. Per ottenere un'ottimizzazione stabile e scalabile, introduce il Rollout Gerarchico Esecutore-Progettista e la Co-evoluzione a Stadi. Questa ricerca è stata pubblicata su arXiv (2605.14212v1) e affronta i limiti posti dal soffitto dell'esecutore congelato nelle attuali metodologie MAS automatiche.
Fatti principali
- MetaAgent-X è un framework di apprendimento per rinforzo end-to-end per sistemi multi-agente automatici.
- Ottimizza congiuntamente la progettazione e l'esecuzione automatica dei MAS.
- Il framework consente la generazione di MAS basati su script, la raccolta di rollout dell'esecuzione e l'assegnazione del credito.
- Propone il Rollout Gerarchico Esecutore-Progettista e la Co-evoluzione a Stadi per la stabilità dell'addestramento.
- L'articolo è pubblicato su arXiv con ID 2605.14212v1.
- Affronta il soffitto dell'esecutore congelato negli approcci MAS automatici esistenti.
Entità
Istituzioni
- arXiv