ARTFEED — Contemporary Art Intelligence

Ottimizzazione Federata Multi-etichetta con Prompt Tuning per Modelli Visione-Linguaggio

publication · 2026-05-28

Un nuovo articolo su arXiv (2605.28347) introduce FedMPT, il primo metodo specificamente progettato per il riconoscimento federato multi-etichetta (MLR) utilizzando modelli visione-linguaggio (VLM). L'approccio affronta il problema dell'overfitting a correlazioni spurie tra etichette quando i VLM vengono adattati a dati client eterogenei e privati in contesti decentralizzati. Applicando un modello causale con aggiustamento front-door, FedMPT disaccoppia il processo MLR attraverso variabili intermedie che amplificano la co-occorrenza delle etichette oracle, guidando il modello verso condizioni generalizzabili per ridurre l'attivazione errata delle etichette.

Fatti principali

  • ID articolo: arXiv:2605.28347
  • Titolo: FedMPT: Ottimizzazione Federata Multi-etichetta con Prompt Tuning di Modelli Visione-Linguaggio
  • Primo metodo per il riconoscimento federato multi-etichetta
  • Utilizza un modello causale con aggiustamento front-door
  • Affronta l'overfitting a correlazioni spurie tra etichette
  • Disaccoppia il MLR tramite variabili intermedie
  • Amplifica la co-occorrenza delle etichette oracle
  • Si concentra su dati client decentralizzati ed eterogenei

Entità

Istituzioni

  • arXiv

Fonti