L'Attribuzione dei Dati Vulnerabile alla Manipolazione nel ML Distribuito

ai-technology · 2026-05-18

Una recente indagine ha scoperto vulnerabilità nell'attribuzione dei dati all'interno del machine learning distribuito, indicando che può essere facilmente sfruttata. I ricercatori dimostrano che un singolo partecipante in un tipico setup di training distribuito può aumentare artificialmente il proprio punteggio di attribuzione senza compromettere le prestazioni complessive. Questo metodo, chiamato attribution-first, utilizza l'ottimizzazione latente per introdurre piccoli batch sintetici che sfruttano la distribuzione non IID delle etichette e le sensibilità del valutatore. L'attacco aumenta in modo affidabile il punteggio di attribuzione dell'avversario su vari dataset, modelli e valutatori di utilità marginale, alterando anche le dinamiche di attribuzione tra i clienti legittimi. In particolare, non compromette l'accuratezza né attiva le difese basate sulla geometria. Questi risultati suggeriscono che l'attribuzione stessa rappresenta un nuovo vettore di attacco, sollevando preoccupazioni per la determinazione dei prezzi, l'audit e la governance nei sistemi di ML. La ricerca è disponibile su arXiv con ID 2605.15520.

Fatti principali

L'attribuzione dei dati nel ML distribuito può essere manipolata da un singolo partecipante.
L'attacco attribution-first utilizza l'ottimizzazione latente per iniettare batch sintetici.
L'attacco sfrutta la copertura non IID delle etichette e le sensibilità del valutatore.
Aumenta il valore di attribuzione dell'avversario senza degradare l'accuratezza.
L'attacco rimodella l'attribuzione relativa tra i clienti benigni.
Non attiva le difese basate sulla geometria.
Lo studio mostra che l'attribuzione costituisce una nuova superficie di attacco.
L'articolo è su arXiv con ID 2605.15520.

L'Attribuzione dei Dati Vulnerabile alla Manipolazione nel ML Distribuito

Fatti principali

Entità

Istituzioni

Fonti