Prima Analisi Sistematica della Sicurezza Rivela Vulnerabilità Critiche nei Modelli AI State-Space

ai-technology · 2026-04-22

Uno studio rivoluzionario ha esposto significative vulnerabilità di sicurezza e protezione nei Modelli State-Space (SSM), una classe di architetture AI sempre più impiegate in applicazioni ad alto rischio. Questi modelli, che includono varianti strutturate come S4, S4D, DSS e S5, architetture selettive come Mamba e Mamba-2, e sistemi ibridi come Jamba, sono utilizzati per analisi genomiche, previsioni di serie temporali cliniche ed elaborazione di log di cybersecurity grazie alla loro efficiente scalabilità lineare nel tempo. La ricerca introduce il primo quadro completo per analizzare i rischi degli SSM, identificando cinque livelli di superfici di attacco. Sono state sviluppate tre nuove classi di attacco: attacchi avversari spettrali che sfruttano i guadagni della funzione di trasferimento, backdoor stateful a trigger ritardato che si attivano migliaia di passi dopo l'iniezione, e attacchi di saturazione della capacità di stato. Il documento stabilisce metriche formali tra cui Violazione dell'Integrità di Stato (StIV) e Rapporto di Amplificazione Cross-Contesto (X_S), con fondamenti teorici nella norma H∞ attraverso una Proposizione di Sensibilità Spettrale. Nonostante i loro vantaggi computazionali, le architetture ricorrenti a stato compresso degli SSM presentano proprietà di sicurezza precedentemente non studiate che potrebbero compromettere sistemi critici per la sicurezza. Il lavoro è stato pubblicato come arXiv:2604.16424v1 con tipo di annuncio cross, rappresentando un trattamento sistematico dei rischi cognitivi insieme a preoccupazioni di sicurezza e protezione.

Fatti principali

I Modelli State-Space (SSM) includono architetture strutturate (S4, S4D, DSS, S5), selettive (Mamba, Mamba-2) e ibride (Jamba)
Gli SSM sono impiegati in applicazioni critiche per la sicurezza: analisi genomiche, previsioni di serie temporali cliniche, elaborazione di log di cybersecurity
La ricerca presenta il primo trattamento sistematico della sicurezza, protezione e rischi cognitivi degli SSM
Sono state sviluppate tre nuove classi di attacco: attacchi avversari spettrali, backdoor stateful a trigger ritardato, attacchi di saturazione della capacità di stato
Il quadro formale include Superficie di Attacco SSM (cinque livelli), Violazione dell'Integrità di Stato (StIV), Rapporto di Amplificazione Cross-Contesto (X_S)
Il fondamento teorico include la Proposizione di Sensibilità Spettrale basata sulla norma H∞
Gli SSM offrono una scalabilità lineare nel tempo ma le loro architetture ricorrenti a stato compresso hanno proprietà di sicurezza non studiate
Articolo pubblicato come arXiv:2604.16424v1 con Tipo di Annuncio: cross

Entità

—

Fonti

arXiv cs.AI — 2026-04-21