Metodo di Flow Matching per l'Adattamento Visione-Linguaggio Few-Shot
Un nuovo articolo su arXiv (2605.05054) critica i metodi esistenti di flow matching (FM) per l'adattamento few-shot di modelli visione-linguaggio, identificando tre limitazioni chiave da una prospettiva di decomposizione polare: distorsione della dinamica angolare dovuta all'accoppiamento radiale-angolare, trascuratezza della dinamica radiale dovuta alla normalizzazione delle caratteristiche che scarta la confidenza della modalità, e generazione incondizionata context-agnostic. Gli autori propongono Direct Product Flow Matching per disaccoppiare le dinamiche radiali e angolari, con l'obiettivo di migliorare le prestazioni di adattamento.
Fatti principali
- Articolo arXiv:2605.05054
- Tipo di annuncio: cross
- Critica i metodi esistenti di flow matching
- Utilizza la prospettiva di decomposizione polare
- Identifica tre limitazioni: distorsione della dinamica angolare, trascuratezza della dinamica radiale, generazione incondizionata context-agnostic
- Propone Direct Product Flow Matching
- Mira a migliorare l'adattamento few-shot di modelli visione-linguaggio
Entità
Istituzioni
- arXiv