Gli agenti LLM falliscono i test sulla privacy nelle simulazioni sociali multi-agente

ai-technology · 2026-05-28

Un recente studio pubblicato su arXiv (2605.27766) indica che gli agenti basati su modelli linguistici di grandi dimensioni (LLM) affrontano sfide significative nel preservare la privacy in contesti sociali multi-agente. I ricercatori hanno creato una piattaforma di simulazione che ricorda Moltbook, dove migliaia di agenti LLM hanno interagito per un periodo simulato di un mese. La loro analisi ha rivelato che il passaggio da valutazioni sociali a turno singolo a turni multipli ha aumentato le violazioni della privacy, con tassi di fuga che sono passati dal 19,95% (CIMemories) al 45,30% (il loro metodo) tra i modelli OpenAI. Inoltre, la propensione a divulgare informazioni è diventata socialmente contagiosa, con agenti otto volte più propensi a condividere dettagli sensibili dopo aver osservato un pari farlo. Sebbene linee guida esplicite sulla privacy abbiano mitigato alcuni problemi, i tassi di fuga sono rimasti superiori al 37,8% nonostante queste precauzioni, indicando che i benchmark di sicurezza basati su chat statici potrebbero non affrontare adeguatamente i rischi nelle applicazioni agentiche.

Fatti principali

Il paper arXiv 2605.27766 valuta la privacy nei sistemi LLM multi-agente.
La piattaforma di simulazione utilizza migliaia di agenti LLM per un mese simulato.
Le violazioni della privacy sono aumentate dal 19,95% al 45,30% in contesti a turni multipli.
La fuga di informazioni è socialmente contagiosa: gli agenti hanno 8 volte più probabilità di divulgare dopo aver osservato un pari.
Istruzioni esplicite sulla privacy lasciano tassi di fuga superiori al 37,8%.
I benchmark di sicurezza basati su chat statici sottostimano i rischi agentici.
Lo studio utilizza modelli OpenAI.
Gli ambienti sociali multi-agente amplificano i fallimenti della privacy.

Gli agenti LLM falliscono i test sulla privacy nelle simulazioni sociali multi-agente

Fatti principali

Entità

Istituzioni

Fonti