Il framework PEAM consente agli agenti di interiorizzare abilità dall'esperienza in Minecraft
Un nuovo framework chiamato PEAM (Parametric Embodied Agent Memory) è stato sviluppato da ricercatori per Minecraft, consentendo agli agenti di apprendere abilità attraverso l'esperienza invece di affidarsi solo all'inferenza durante il recupero. Questo framework combina un grande modello linguistico deliberativo, che facilita il ragionamento aperto, con un modulo parametrico rapido progettato per azioni riflesse. Il modulo veloce utilizza un'architettura multimodale Mixture-of-Experts LoRA, con adattatori fisicamente isolati per ogni categoria, che supporta l'apprendimento continuo senza il rischio di dimenticanza catastrofica. I fallimenti sono riconosciuti come preziosi segnali di addestramento, con coppie di traiettorie di correzione degli errori integrate attraverso obiettivi congiunti di behavioral-cloning e contrastive learning. Inoltre, PEAM implementa un punteggio di parametrizzabilità per determinare quali esperienze interiorizzare e include un meccanismo di self-tri senza scala. La ricerca è stata pubblicata su arXiv con ID 2605.27762.
Fatti principali
- PEAM sta per Parametric Embodied Agent Memory
- Il framework trasforma la memoria dell'agente dal recupero tramite inferenza a abilità residenti nei parametri
- Utilizza un LLM deliberativo lento e un modulo parametrico veloce
- Il modulo veloce è un'architettura multimodale Mixture-of-Experts LoRA
- Adattatori fisicamente isolati per categoria prevengono la dimenticanza catastrofica
- Coppie di traiettorie di correzione degli errori sono interiorizzate tramite behavioral-cloning e contrastive learning
- Introduce un punteggio di parametrizzabilità per la selezione delle esperienze
- Articolo pubblicato su arXiv: 2605.27762
Entità
Istituzioni
- arXiv