Attacchi Semantici alla Catena di Fornitura nei Registri delle Competenze degli Agenti AI
Una recente indagine pubblicata su arXiv (2605.11418) indica che gli agenti AI autonomi sono suscettibili ad attacchi semantici alla catena di fornitura tramite i loro file SKILL.md. Questi documenti delineano le condizioni in cui gli agenti impiegano competenze modulari e possono essere sfruttati per influenzare la scoperta, la selezione e la governance delle competenze. Utilizzando competenze reali di ClawHub e sistemi di registro realistici, i ricercatori hanno dimostrato che brevi prompt testuali durante la fase di Scoperta possono manipolare il recupero basato su embedding, raggiungendo un tasso di vittoria a coppie dell'86% e un posizionamento Top-10 dell'80% per le competenze avversarie. Nella fase di Selezione, l'inquadramento basato esclusivamente sulle descrizioni ha portato gli agenti a favorire varianti avversarie funzionalmente simili nel 77,6% delle prove. La ricerca evidenzia anche metodi di elusione semantica nella Governance, dove i metadati in linguaggio naturale possono aggirare le misure di sicurezza, sottolineando nuovi rischi negli ecosistemi di agenti AI.
Fatti principali
- Il paper arXiv 2605.11418 studia gli attacchi semantici alla catena di fornitura nei registri delle competenze degli agenti AI.
- Gli attacchi prendono di mira i file SKILL.md utilizzati dagli agenti AI autonomi.
- Fase di Scoperta: i trigger testuali raggiungono un tasso di vittoria a coppie dell'86% e un posizionamento Top-10 dell'80%.
- Fase di Selezione: varianti avversarie selezionate nel 77,6% delle prove a coppie.
- Fase di Governance: l'elusione semantica bypassa i controlli di sicurezza.
- Lo studio utilizza competenze reali di ClawHub e meccanismi di registro realistici.
- I metadati in linguaggio naturale possono manipolare il recupero basato su embedding.
- La ricerca evidenzia nuovi rischi negli ecosistemi di agenti AI.
Entità
Istituzioni
- arXiv
- ClawHub