E-MIA: Attacchi di Inferenza di Appartenenza a Scatola Nera su Sistemi RAG

ai-technology · 2026-05-06

Un nuovo metodo di attacco, E-MIA, prende di mira i sistemi Retrieval-Augmented Generation (RAG) inferendo se un documento specifico fa parte della base di conoscenza. In uno scenario a scatola nera, un avversario può determinare l'appartenenza del documento solo dalle interazioni con le risposte alle query, rivelando la copertura sensibile del corpus. I metodi esistenti di attacco di inferenza di appartenenza (MIA) per RAG si basano su segnali deboli come la similarità semantica, che producono distribuzioni di punteggio sovrapposte, o utilizzano sonde di conferma esplicite facilmente rilevabili. E-MIA converte prove concrete verificabili dal documento target—come dettagli granulari, nomi propri, termini tecnici, affermazioni definitorie e metadati—in sonde efficaci. Il metodo è progettato per essere furtivo e robusto contro rifiuti o rilevamento. L'articolo è pubblicato su arXiv con ID 2605.00955.

Fatti principali

1. E-MIA è un attacco di inferenza di appartenenza contro sistemi RAG.
2. Opera in uno scenario a scatola nera utilizzando interazioni con le risposte alle query.
3. L'attacco inferisce se un documento candidato è nella base di conoscenza RAG.
4. Rivela la copertura del corpus e l'esistenza di argomenti sensibili.
5. I metodi MIA RAG esistenti si basano su segnali deboli o sonde esplicite.
6. E-MIA utilizza prove concrete verificabili dal documento target.
7. Le prove includono dettagli granulari, nomi propri, termini tecnici, affermazioni definitorie e metadati.
8. L'articolo è disponibile su arXiv con ID 2605.00955.

E-MIA: Attacchi di Inferenza di Appartenenza a Scatola Nera su Sistemi RAG

Fatti principali

Entità

Istituzioni

Fonti