StructBreak: Nuovo Framework Espone Fallimenti di Sicurezza nei LLM Multimodali

ai-technology · 2026-05-26

I ricercatori hanno identificato una nuova vulnerabilità nei Modelli Linguistici Multimodali di Grandi Dimensioni (MLLM) chiamata Sovraccarico Cognitivo Strutturale (SCO), in cui il ragionamento profondo entra in conflitto con l'allineamento della sicurezza, causando fragilità logica. Per affrontare questo problema, hanno sviluppato StructBreak, un framework automatizzato end-to-end che quantifica lo SCO in contesti black-box pratici senza accesso interno al modello. Il framework stabilisce un benchmark su dieci scenari di minaccia. Valutazioni empiriche su sei MLLM leader mostrano un tasso medio di successo dell'attacco (ASR) del 92% nell'innescare generazione tossica. Questo lavoro evidenzia un paradigma di attacco precedentemente inesplorato oltre le perturbazioni tipografiche e a livello di pixel.

Fatti principali

StructBreak è un framework automatizzato end-to-end per quantificare il Sovraccarico Cognitivo Strutturale (SCO) nei MLLM.
Lo SCO è un fenomeno in cui il ragionamento profondo e l'allineamento della sicurezza competono, causando fragilità logica.
I lavori precedenti si concentravano su perturbazioni tipografiche e a livello di pixel, non sullo SCO.
StructBreak opera in un contesto black-box, senza richiedere accesso interno al modello.
Il framework stabilisce un benchmark che copre dieci diversi scenari di minaccia.
Valutazioni empiriche su sei MLLM leader rivelano un ASR medio del 92% per la generazione tossica.
La ricerca scopre un nuovo paradigma di attacco di sovraccarico cognitivo di ordine superiore.
Lo studio è stato pubblicato su arXiv con ID 2605.25534.

StructBreak: Nuovo Framework Espone Fallimenti di Sicurezza nei LLM Multimodali

Fatti principali

Entità

Istituzioni

Fonti