Ottimizzazione Federata Multi-etichetta con Prompt Tuning per Modelli Visione-Linguaggio
Un nuovo articolo su arXiv (2605.28347) introduce FedMPT, il primo metodo specificamente progettato per il riconoscimento federato multi-etichetta (MLR) utilizzando modelli visione-linguaggio (VLM). L'approccio affronta il problema dell'overfitting a correlazioni spurie tra etichette quando i VLM vengono adattati a dati client eterogenei e privati in contesti decentralizzati. Applicando un modello causale con aggiustamento front-door, FedMPT disaccoppia il processo MLR attraverso variabili intermedie che amplificano la co-occorrenza delle etichette oracle, guidando il modello verso condizioni generalizzabili per ridurre l'attivazione errata delle etichette.
Fatti principali
- ID articolo: arXiv:2605.28347
- Titolo: FedMPT: Ottimizzazione Federata Multi-etichetta con Prompt Tuning di Modelli Visione-Linguaggio
- Primo metodo per il riconoscimento federato multi-etichetta
- Utilizza un modello causale con aggiustamento front-door
- Affronta l'overfitting a correlazioni spurie tra etichette
- Disaccoppia il MLR tramite variabili intermedie
- Amplifica la co-occorrenza delle etichette oracle
- Si concentra su dati client decentralizzati ed eterogenei
Entità
Istituzioni
- arXiv