Adattamento di Agenti LLM tramite Memoria Semantica ed Episodica
Un nuovo framework potenziato dalla memoria consente agli agenti basati su grandi modelli linguistici (LLM) di apprendere compiti di classificazione da esempi etichettati senza aggiornamenti dei parametri. L'approccio memorizza critiche a livello di istanza nella memoria episodica e le distilla in linee guida riutilizzabili a livello di compito nella memoria semantica. Attraverso diversi compiti e modelli, la migliore strategia di autocritica che utilizza entrambi i tipi di memoria ha ottenuto un miglioramento medio di 8,1 punti percentuali rispetto ai basamenti zero-shot e di 4,6 punti rispetto a un basamento basato su RAG che si affidava solo alle etichette. Le prestazioni variavano sostanzialmente tra modelli e domini, portando i ricercatori a introdurre la 'suggestionabilità' come metrica per spiegare questa variazione. L'articolo è disponibile su arXiv con identificatore 2510.19897.
Fatti principali
- Il framework utilizza la memoria episodica e semantica per l'adattamento degli agenti LLM senza aggiornamenti dei parametri.
- La migliore strategia di autocritica migliora di 8,1 punti percentuali rispetto al basamento zero-shot.
- Migliora di 4,6 punti percentuali rispetto al basamento basato su RAG.
- Le prestazioni variano tra modelli e domini.
- Introduce la metrica 'suggestionabilità' per spiegare la variazione.
- Articolo disponibile su arXiv: 2510.19897.
Entità
Istituzioni
- arXiv