E-MIA: Attacchi di Inferenza di Appartenenza a Scatola Nera su Sistemi RAG
Un nuovo metodo di attacco, E-MIA, prende di mira i sistemi Retrieval-Augmented Generation (RAG) inferendo se un documento specifico fa parte della base di conoscenza. In uno scenario a scatola nera, un avversario può determinare l'appartenenza del documento solo dalle interazioni con le risposte alle query, rivelando la copertura sensibile del corpus. I metodi esistenti di attacco di inferenza di appartenenza (MIA) per RAG si basano su segnali deboli come la similarità semantica, che producono distribuzioni di punteggio sovrapposte, o utilizzano sonde di conferma esplicite facilmente rilevabili. E-MIA converte prove concrete verificabili dal documento target—come dettagli granulari, nomi propri, termini tecnici, affermazioni definitorie e metadati—in sonde efficaci. Il metodo è progettato per essere furtivo e robusto contro rifiuti o rilevamento. L'articolo è pubblicato su arXiv con ID 2605.00955.
Fatti principali
- 1. E-MIA è un attacco di inferenza di appartenenza contro sistemi RAG.
- 2. Opera in uno scenario a scatola nera utilizzando interazioni con le risposte alle query.
- 3. L'attacco inferisce se un documento candidato è nella base di conoscenza RAG.
- 4. Rivela la copertura del corpus e l'esistenza di argomenti sensibili.
- 5. I metodi MIA RAG esistenti si basano su segnali deboli o sonde esplicite.
- 6. E-MIA utilizza prove concrete verificabili dal documento target.
- 7. Le prove includono dettagli granulari, nomi propri, termini tecnici, affermazioni definitorie e metadati.
- 8. L'articolo è disponibile su arXiv con ID 2605.00955.
Entità
Istituzioni
- arXiv