PolicyBank: Gli Agenti LLM Evolvono la Comprensione delle Politiche Attraverso Feedback Interattivo
PolicyBank ha svelato un meccanismo di memoria mirato a migliorare il modo in cui gli agenti LLM comprendono le politiche organizzative attraverso l'interazione e la correzione del feedback. A differenza dei metodi tradizionali che considerano le politiche come verità fisse, PolicyBank offre approfondimenti strutturati a livello di strumento e li adatta continuamente per risolvere ambiguità e carenze nelle descrizioni in linguaggio naturale. Questo sistema cerca di evitare l'emergere di comportamenti "conformi ma errati" che si discostano dai requisiti effettivi. I ricercatori hanno sviluppato un banco di prova sistematico modificando un benchmark ampiamente utilizzato per il richiamo di strumenti, includendo lacune politiche controllate, distinguendo così i fallimenti di allineamento dai problemi di esecuzione. Questo approccio affronta le complessità che gli agenti LLM incontrano quando operano sotto vincoli di autorizzazione in linguaggio naturale, che spesso presentano inconsistenze logiche o semantiche. La ricerca, identificata come arXiv 2604.15505v1, introduce una prospettiva innovativa per migliorare l'aderenza degli agenti alle politiche organizzative.
Fatti principali
- PolicyBank è un meccanismo di memoria per agenti LLM
- Aiuta gli agenti a perfezionare la comprensione delle politiche attraverso l'interazione e il feedback correttivo
- Affronta ambiguità e lacune nelle specifiche delle politiche in linguaggio naturale
- Previene comportamenti "conformi ma errati"
- Mantiene approfondimenti strutturati sulle politiche a livello di strumento
- Perfeziona iterativamente le interpretazioni delle politiche
- Utilizza un banco di prova sistematico che estende un popolare benchmark per il richiamo di strumenti
- Ricerca annunciata su arXiv con identificatore 2604.15505v1
Entità
Istituzioni
- arXiv