Framework Multi-Agente Ottimizza la Pianificazione a Lungo Termine con RL Centrato sul Planner
Un recente articolo pubblicato su arXiv introduce un nuovo framework per la collaborazione multi-agente finalizzato alla pianificazione a lungo termine attraverso l'uso di modelli linguistici. Questo framework suddivide l'automazione in tre ruoli distinti: un planner per il processo decisionale generale, un attore per l'esecuzione dei compiti e un gestore di memoria per il ragionamento contestuale. Il contributo principale degli autori è un'analisi completa dell'allocazione delle risorse di calcolo, che rivela che la pianificazione ha un impatto significativo sulle prestazioni del compito, mentre l'esecuzione e la gestione della memoria richiedono molta meno potenza computazionale e capacità del modello. Sulla base di questi risultati, propongono un metodo di apprendimento per rinforzo incentrato sul planner, che ottimizza il planner in base ai premi a livello di traiettoria provenienti da un VLM-as-judge. L'articolo è disponibile su arXiv:2605.02168.
Fatti principali
- L'articolo arXiv 2605.02168 propone un framework multi-agente per la pianificazione a lungo termine
- Il framework ha tre ruoli: planner, attore, gestore di memoria
- La pianificazione è il fattore dominante nelle prestazioni del compito
- Esecuzione e gestione della memoria richiedono meno risorse di calcolo
- L'apprendimento per rinforzo centrato sul planner ottimizza solo il planner
- Utilizza premi a livello di traiettoria da un VLM-as-judge
- Pubblicato su arXiv
- Tipo di annuncio: nuovo
Entità
Istituzioni
- arXiv