LACUNA: Un Modello di Programmazione più Sicuro per Agenti LLM che Scrivono Codice
I ricercatori hanno introdotto LACUNA, un modello di programmazione progettato per agenti LLM che generano codice, affrontando i problemi di sicurezza che sorgono quando tale codice determina il comportamento a runtime. Questo modello colma il divario tra l'ambiente di runtime dell'agente e il codice che produce, consentendo al codice generato di influenzare le azioni a runtime garantendo al contempo la sicurezza attraverso chiamate tipizzate e type-checking. Ogni azione compiuta dall'agente è una chiamata tipizzata agent[T](task), in cui l'LLM inietta codice durante l'esecuzione, che viene poi sottoposto a type-checking rispetto al programma esistente prima dell'esecuzione. Trattando le azioni come un tutt'uno, il sistema evita fallimenti parziali e stati inconsistenti, cercando di migliorare l'espressività dell'agente senza sacrificare la sicurezza.
Fatti principali
- LACUNA è un modello di programmazione per agenti LLM che scrivono codice
- Colma la separazione tra runtime dell'agente e codice scritto dal modello
- Ogni azione dell'agente è una chiamata tipizzata agent[T](task)
- Il codice viene sottoposto a type-checking rispetto al programma circostante prima dell'esecuzione
- Le azioni vengono accettate o rifiutate nel loro insieme
- Il modello affronta problemi di sicurezza derivanti da injection di prompt, chiamate a strumenti errate e fallimenti parziali
- L'articolo è su arXiv con identificatore 2605.28617
Entità
Istituzioni
- arXiv