Framework Multi-Agente Ottimizza la Pianificazione a Lungo Termine con RL Centrato sul Planner

ai-technology · 2026-05-06

Un recente articolo pubblicato su arXiv introduce un nuovo framework per la collaborazione multi-agente finalizzato alla pianificazione a lungo termine attraverso l'uso di modelli linguistici. Questo framework suddivide l'automazione in tre ruoli distinti: un planner per il processo decisionale generale, un attore per l'esecuzione dei compiti e un gestore di memoria per il ragionamento contestuale. Il contributo principale degli autori è un'analisi completa dell'allocazione delle risorse di calcolo, che rivela che la pianificazione ha un impatto significativo sulle prestazioni del compito, mentre l'esecuzione e la gestione della memoria richiedono molta meno potenza computazionale e capacità del modello. Sulla base di questi risultati, propongono un metodo di apprendimento per rinforzo incentrato sul planner, che ottimizza il planner in base ai premi a livello di traiettoria provenienti da un VLM-as-judge. L'articolo è disponibile su arXiv:2605.02168.

Fatti principali

L'articolo arXiv 2605.02168 propone un framework multi-agente per la pianificazione a lungo termine
Il framework ha tre ruoli: planner, attore, gestore di memoria
La pianificazione è il fattore dominante nelle prestazioni del compito
Esecuzione e gestione della memoria richiedono meno risorse di calcolo
L'apprendimento per rinforzo centrato sul planner ottimizza solo il planner
Utilizza premi a livello di traiettoria da un VLM-as-judge
Pubblicato su arXiv
Tipo di annuncio: nuovo

Framework Multi-Agente Ottimizza la Pianificazione a Lungo Termine con RL Centrato sul Planner

Fatti principali

Entità

Istituzioni

Fonti