MemMorph: Attacco di Avvelenamento della Memoria sulla Selezione degli Strumenti degli Agenti LLM

other · 2026-05-27

MemMorph è stato presentato dai ricercatori come il primo attacco che distorce la selezione degli strumenti negli agenti basati su LLM corrompendo la loro memoria a lungo termine. A differenza degli attacchi precedenti che alterano i metadati degli strumenti—facilmente identificabili tramite audit—MemMorph introduce un numero limitato di voci meticolosamente create che si spacciano per fatti tecnici, politiche operative e rapporti di incidenti. Questa manipolazione altera la comprensione e i processi decisionali dell'agente, spingendolo a scegliere autonomamente lo strumento preferito dall'attaccante. Il metodo prende di mira specificamente gli agenti che migliorano le strategie di selezione degli strumenti basandosi su esperienze accumulate, rendendolo sia furtivo che duraturo. Questo studio è disponibile su arXiv con ID 2605.26154.

Fatti principali

MemMorph è il primo attacco ad avvelenare la memoria a lungo termine negli agenti LLM.
L'attacco inietta record creati mascherati da fatti tecnici, rapporti di incidenti e politiche operative.
Prende di mira agenti che utilizzano moduli di memoria per la selezione degli strumenti.
Gli attacchi precedenti manipolavano i metadati degli strumenti, facilmente rilevabili.
I record avvelenati rimodellano la percezione contestuale e il processo decisionale.
L'agente seleziona autonomamente lo strumento preferito dall'attaccante.
Articolo pubblicato su arXiv con ID 2605.26154.
L'attacco è furtivo e persistente.

MemMorph: Attacco di Avvelenamento della Memoria sulla Selezione degli Strumenti degli Agenti LLM

Fatti principali

Entità

Istituzioni

Fonti