ARTFEED — Contemporary Art Intelligence

Attacchi Semantici alla Catena di Fornitura nei Registri delle Competenze degli Agenti AI

ai-technology · 2026-05-13

Una recente indagine pubblicata su arXiv (2605.11418) indica che gli agenti AI autonomi sono suscettibili ad attacchi semantici alla catena di fornitura tramite i loro file SKILL.md. Questi documenti delineano le condizioni in cui gli agenti impiegano competenze modulari e possono essere sfruttati per influenzare la scoperta, la selezione e la governance delle competenze. Utilizzando competenze reali di ClawHub e sistemi di registro realistici, i ricercatori hanno dimostrato che brevi prompt testuali durante la fase di Scoperta possono manipolare il recupero basato su embedding, raggiungendo un tasso di vittoria a coppie dell'86% e un posizionamento Top-10 dell'80% per le competenze avversarie. Nella fase di Selezione, l'inquadramento basato esclusivamente sulle descrizioni ha portato gli agenti a favorire varianti avversarie funzionalmente simili nel 77,6% delle prove. La ricerca evidenzia anche metodi di elusione semantica nella Governance, dove i metadati in linguaggio naturale possono aggirare le misure di sicurezza, sottolineando nuovi rischi negli ecosistemi di agenti AI.

Fatti principali

  • Il paper arXiv 2605.11418 studia gli attacchi semantici alla catena di fornitura nei registri delle competenze degli agenti AI.
  • Gli attacchi prendono di mira i file SKILL.md utilizzati dagli agenti AI autonomi.
  • Fase di Scoperta: i trigger testuali raggiungono un tasso di vittoria a coppie dell'86% e un posizionamento Top-10 dell'80%.
  • Fase di Selezione: varianti avversarie selezionate nel 77,6% delle prove a coppie.
  • Fase di Governance: l'elusione semantica bypassa i controlli di sicurezza.
  • Lo studio utilizza competenze reali di ClawHub e meccanismi di registro realistici.
  • I metadati in linguaggio naturale possono manipolare il recupero basato su embedding.
  • La ricerca evidenzia nuovi rischi negli ecosistemi di agenti AI.

Entità

Istituzioni

  • arXiv
  • ClawHub

Fonti