RSCB-MC: Controllo della Memoria Sensibile al Rischio per Agenti di Codifica basati su LLM
Una recente pubblicazione su arXiv (2604.27283) presenta RSCB-MC, un controller di memoria progettato per agenti di codifica basati su LLM che è sensibile al rischio in scenari di contextual bandit. Invece di affrontare il recupero della memoria come un problema top-k, questo sistema valuta se rinunciare alla memoria, introdurre una risoluzione top, riassumere varie opzioni, impegnarsi in un recupero ad alta precisione o alto richiamo, astenersi o cercare feedback. Utilizza uno schema pattern-variante-episodio per memorizzare conoscenze riutilizzabili sui problemi e trasforma le prove di recupero in un vettore coerente a 16 caratteristiche. Questa ricerca ridefinisce l'utilizzo della memoria dei problemi come un problema di controllo selettivo sensibile al rischio, con l'obiettivo di prevenire iniezioni di memoria non sicure causate da somiglianze superficiali in stack trace, errori o percorsi.
Fatti principali
- L'articolo è su arXiv con ID 2604.27283
- Introduce il controller di memoria RSCB-MC
- Utilizza un approccio contextual bandit sensibile al rischio
- Decide tra molteplici azioni inclusa l'astensione
- Memorizza la conoscenza tramite schema pattern-variante-episodio
- Converte le prove di recupero in un vettore a 16 caratteristiche
- Mira a prevenire l'iniezione di memoria non sicura
- Si concentra su agenti di codifica basati su LLM
Entità
Istituzioni
- arXiv