Ottimizzazione Federata Multi-etichetta con Prompt Tuning per Modelli Visione-Linguaggio

publication · 2026-05-28

Un nuovo articolo su arXiv (2605.28347) introduce FedMPT, il primo metodo specificamente progettato per il riconoscimento federato multi-etichetta (MLR) utilizzando modelli visione-linguaggio (VLM). L'approccio affronta il problema dell'overfitting a correlazioni spurie tra etichette quando i VLM vengono adattati a dati client eterogenei e privati in contesti decentralizzati. Applicando un modello causale con aggiustamento front-door, FedMPT disaccoppia il processo MLR attraverso variabili intermedie che amplificano la co-occorrenza delle etichette oracle, guidando il modello verso condizioni generalizzabili per ridurre l'attivazione errata delle etichette.

Fatti principali

ID articolo: arXiv:2605.28347
Titolo: FedMPT: Ottimizzazione Federata Multi-etichetta con Prompt Tuning di Modelli Visione-Linguaggio
Primo metodo per il riconoscimento federato multi-etichetta
Utilizza un modello causale con aggiustamento front-door
Affronta l'overfitting a correlazioni spurie tra etichette
Disaccoppia il MLR tramite variabili intermedie
Amplifica la co-occorrenza delle etichette oracle
Si concentra su dati client decentralizzati ed eterogenei

Ottimizzazione Federata Multi-etichetta con Prompt Tuning per Modelli Visione-Linguaggio

Fatti principali

Entità

Istituzioni

Fonti