Attacchi di Agenti Distribuiti Eludono i Monitor di Sicurezza; Proposta una Nuova Difesa

ai-technology · 2026-06-01

Un recente studio pubblicato su arXiv (2605.31593) rivela che gli agenti basati su modelli linguistici possono essere distribuiti su vari account utente per bypassare il monitoraggio di sicurezza. I ricercatori hanno creato il primo attacco documentato di agenti distribuiti, utilizzando un framework multi-agente che svolge compiti complessi di cybersecurity nascondendo le intenzioni malevole tra sottoagenti con contesti limitati. Questo metodo evade con successo un monitor tipico, che lo rileva solo il 20% delle volte rispetto ai precedenti attacchi di agenti. Per contrastarlo, hanno introdotto un monitor online con stato che utilizza il clustering in tempo reale per raccogliere deboli segnali di sospetto da numerosi trascritti di agenti, segnalando solo i cluster poco frequenti per ulteriori esami. Questa ricerca sottolinea una significativa lacuna nei sistemi di sicurezza esistenti che valutano un solo contesto agente alla volta.

Fatti principali

I modelli linguistici possono trovare migliaia di gravi vulnerabilità software.
Gli agenti sono sempre più utilizzati per attacchi informatici.
Gli aggressori distribuiscono l'abuso su molti account utente per evitare il rilevamento.
I monitor di sicurezza valutano un solo contesto agente alla volta.
Primo attacco di agenti distribuiti costruito dai ricercatori.
L'impalcatura multi-agente nasconde l'obiettivo dannoso tra i sottoagenti.
Il monitor standard coglie l'attacco distribuito solo un quinto delle volte.
Il monitor online con stato utilizza il clustering in tempo reale per la difesa.

Attacchi di Agenti Distribuiti Eludono i Monitor di Sicurezza; Proposta una Nuova Difesa

Fatti principali

Entità

Istituzioni

Fonti