Preping: Costruire la Memoria degli Agenti senza Compiti
Un nuovo framework chiamato Preping affronta il divario di avvio a freddo nella memoria degli agenti costruendo memoria procedurale prima di qualsiasi esperienza specifica del compito. La memoria degli agenti viene tipicamente costruita offline a partire da dimostrazioni curate o online da interazioni post-distribuzione, ma gli agenti affrontano un divario di avvio a freddo quando vengono introdotti in un nuovo ambiente senza esperienza specifica del compito. Preping utilizza la pratica sintetica autogenerata per costruire memoria, ma la sola interazione sintetica è insufficiente a causa di ridondanza, inattuabilità e compiti non informativi, nonché del degrado della memoria dovuto a traiettorie non filtrate. Il framework impiega la memoria propositrice, uno stato di controllo strutturato che modella la pratica futura, e un Propositore genera compiti sintetici condizionati da questa memoria. L'articolo è disponibile su arXiv con identificatore 2605.13880.
Fatti principali
- Preping è un framework per costruire la memoria degli agenti senza compiti.
- Affronta il divario di avvio a freddo quando gli agenti vengono introdotti in nuovi ambienti.
- La memoria degli agenti viene tipicamente costruita offline da dimostrazioni curate o online da interazioni post-distribuzione.
- La sola interazione sintetica è insufficiente a causa di ridondanza, inattuabilità e compiti non informativi.
- La memoria si degrada rapidamente a causa di traiettorie non filtrate.
- Preping utilizza la memoria propositrice, uno stato di controllo strutturato.
- Un Propositore genera compiti sintetici condizionati dalla memoria propositrice.
- L'articolo è su arXiv con identificatore 2605.13880.
Entità
Istituzioni
- arXiv