PragLocker: Proteggere i Prompt degli Agenti da Riutilizzo Non Autorizzato
Un team di ricercatori ha introdotto PragLocker, una strategia progettata per salvaguardare i prompt degli agenti LLM come proprietà intellettuale in ambienti privi di fiducia. Questo sistema innovativo affronta quattro problemi principali: proattività, sicurezza runtime, usabilità e non portabilità. Incorporando semantica nei simboli del codice e aggiungendo rumore basato sul feedback del modello target, PragLocker genera prompt offuscati che preservano la funzione, assicurando che operino esclusivamente con il LLM designato. Test condotti su vari sistemi agenti, dataset e LLM fondamentali dimostrano che PragLocker limita significativamente la portabilità tra LLM, preservando al contempo le prestazioni target e la resilienza contro minacce adattive. Questa ricerca è stata pubblicata su arXiv con l'identificatore 2605.05974.
Fatti principali
- PragLocker è uno schema di protezione dei prompt per agenti LLM.
- Affronta proattività, protezione runtime, usabilità e non portabilità.
- Costruisce prompt offuscati utilizzando simboli del codice e feedback del modello target.
- Gli esperimenti mostrano una ridotta portabilità tra LLM e prestazioni target mantenute.
- Pubblicato su arXiv con ID 2605.05974.
- La ricerca si rivolge a distribuzioni non fidate di agenti LLM.
- Gli avversari possono copiare i prompt per usarli con altri LLM proprietari.
- Lo schema è robusto contro attaccanti adattivi.
Entità
Istituzioni
- arXiv