La distillazione guidata dall'energia migliora il flow matching discreto a pochi passi
Un nuovo metodo chiamato Trajectory-Shaped Discrete Flow Matching (TS-DFM) migliora la generazione di testo a pochi passi sostituendo i salti stocastici ciechi nelle traiettorie di addestramento con una navigazione guidata utilizzando una bussola energetica leggera. L'approccio affronta il collo di bottiglia delle traiettorie di scarsa qualità piuttosto che l'insufficiente capacità dello studente. TS-DFM valuta le continuazioni candidate in ogni punto intermedio durante l'addestramento, selezionando il percorso più coerente, mentre il costo di inferenza rimane invariato. Esperimenti su modelli linguistici con 170 milioni di parametri dimostrano l'efficacia. Il paper è pubblicato su arXiv con ID 2605.07924.
Fatti principali
- TS-DFM sostituisce i salti stocastici ciechi con una navigazione guidata nelle traiettorie di addestramento.
- Una bussola energetica leggera valuta le continuazioni candidate in ogni punto intermedio.
- Tutta la modellazione avviene solo durante l'addestramento; il costo di inferenza è invariato.
- Il metodo affronta il collo di bottiglia della traiettoria, non la capacità dello studente.
- Esperimenti su modelli linguistici con 170 milioni di parametri.
- Paper pubblicato su arXiv con ID 2605.07924.
- Il flow matching discreto genera testo trasformando iterativamente token di rumore.
- La distillazione utilizza una traiettoria multi-passo per addestrare uno studente alla generazione a pochi passi.
Entità
Istituzioni
- arXiv