ARTFEED — Contemporary Art Intelligence

PermFlow: Un Framework di Flow Matching per l'Apprendimento di Permutazioni Multimodali

other · 2026-05-20

PermFlow è un framework progettato per il flow matching condizionale che apprende permutazioni affrontando il problema del collasso della distribuzione multimodale in situazioni ambigue. A differenza delle tecniche differenziabili tradizionali che si basano su metodi Sinkhorn regolarizzati dall'entropia, i quali producono un unico output ammorbidito, PermFlow opera direttamente nel sottospazio affine delle matrici in cui sia le somme per riga che per colonna sono uguali a uno. Utilizza un proiettore in forma chiusa nello spazio tangente per mantenere questi vincoli esattamente lungo ogni traiettoria, eliminando la necessità di aggiustamenti iterativi. Sfruttando un accoppiamento al target più vicino, indirizza diverse inizializzazioni rumorose verso permutazioni valide uniche, consentendo al modello di catturare efficacemente distribuzioni di permutazioni multimodali. In compiti di ordinamento visivo con ambiguità di cifre mescolate e assegnazione lineare simmetrica, PermFlow dimostra un'accuratezza impressionante con input non ambigui e recupera con successo permutazioni valide in presenza di ambiguità. Il framework completo è descritto in arXiv:2605.16755.

Fatti principali

  • PermFlow è un framework di flow matching condizionale per l'apprendimento di permutazioni.
  • Affronta le distribuzioni di permutazioni multimodali in condizioni di ambiguità.
  • I metodi esistenti basati su Sinkhorn regolarizzato dall'entropia collassano in presenza di ambiguità.
  • PermFlow opera sul sottospazio affine delle matrici con somme per riga e colonna unitarie.
  • Un proiettore in forma chiusa nello spazio tangente preserva esattamente i vincoli.
  • L'accoppiamento al target più vicino indirizza inizializzazioni distinte verso permutazioni distinte.
  • Testato su ordinamento visivo con ambiguità di cifre mescolate e assegnazione lineare simmetrica.
  • Raggiunge alta accuratezza su input non ambigui e recupera entrambe le permutazioni valide in caso di ambiguità.

Entità

Istituzioni

  • arXiv

Fonti