CODESKILL: Un framework basato su LLM per agenti di codifica auto-evolventi
Uno studio recente presenta CODESKILL, un framework progettato per agenti di codifica per sviluppare e migliorare le competenze attraverso le proprie esperienze di risoluzione dei compiti. A differenza degli approcci tradizionali che dipendono da prompt statici e linee guida euristiche, CODESKILL impiega una politica di gestione basata su LLM e addestrata tramite apprendimento per rinforzo. Deriva competenze procedurali multi-granularità dalle traiettorie degli agenti, le perfeziona con nuove esperienze e mantiene un repository di competenze conciso per i compiti futuri. Il sistema di ricompensa ibrido integra sia valutazioni dense basate su rubriche della qualità delle competenze sia segnali di esecuzione sparsi e verificabili. Questa ricerca è accessibile su arXiv con l'identificatore 2605.25430.
Fatti principali
- CODESKILL è un framework basato su LLM per l'auto-evoluzione degli agenti di codifica.
- Estrae competenze procedurali multi-granularità dalle traiettorie degli agenti di codifica.
- Le competenze vengono evolute con nuove esperienze e mantenute in un repository compatto.
- Il framework è addestrato con apprendimento per rinforzo.
- La ricompensa utilizza feedback denso basato su rubriche della qualità delle competenze e segnali di esecuzione sparsi e verificabili.
- I metodi esistenti si basano su prompt fissi e regole di aggiornamento euristiche.
- L'articolo è pubblicato su arXiv con ID 2605.25430.
- L'approccio riformula l'estrazione e la manutenzione delle competenze come una politica di gestione apprendibile.
Entità
Istituzioni
- arXiv