Il livellamento mediano migliora la robustezza del rilevamento OOD
Un nuovo framework chiamato ROSS (Robust Out-of-distribution Detection via Synergistic Smoothing) migliora la robustezza avversaria nel rilevamento OOD. Il metodo applica il livellamento mediano ai punteggi OOD di base, bilanciando le accuratezze su dati puliti e avversari. Riusa i campioni rumorosi del livellamento mediano per quantificare l'instabilità locale, scoprendo che i campioni OOD mostrano una maggiore instabilità sotto perturbazione. ROSS raggiunge una robustezza simmetrica contro attacchi che minimizzano e massimizzano il punteggio. Il lavoro è pubblicato su arXiv (2605.08191) e affronta una vulnerabilità critica nella sicurezza del machine learning.
Fatti principali
- L'articolo arXiv 2605.08191 introduce il framework ROSS
- ROSS applica il livellamento mediano ai punteggi di rilevamento OOD
- Il metodo riusa i campioni rumorosi per quantificare l'instabilità locale
- I campioni OOD mostrano una maggiore instabilità sotto perturbazione
- ROSS raggiunge una robustezza simmetrica contro attacchi che minimizzano e massimizzano il punteggio
- Affronta la vulnerabilità avversaria nei rilevatori OOD allo stato dell'arte
Entità
Istituzioni
- arXiv