Nuova Famiglia di Perdite per l'Ottimizzazione di GFlowNet e LLM

other · 2026-05-18

È stato pubblicato uno studio che presenta una collezione di funzioni di perdita surrogate per l'addestramento di modelli generativi, come GFlowNet e grandi modelli linguistici (LLM). I ricercatori dimostrano che l'errore quadratico medio, che misura la differenza tra le probabilità logaritmiche target e del modello ed è stato una perdita efficace a bassa varianza, può essere generalizzato per comprendere l'intero insieme delle f-divergenze. Questa famiglia innovativa di perdite presenta la caratteristica che, quando valutata on-policy, i loro gradienti si allineano con quelli della rispettiva f-divergenza, mantenendo lo stesso minimizzatore globale off-policy. La ricerca stabilisce un collegamento diretto tra funzioni di perdita invarianti per traslazione sulle probabilità logaritmiche e f-divergenze, facilitando la creazione di nuove perdite surrogate per ottimizzare vari modelli generativi. L'articolo è disponibile su arXiv con identificatore 2605.15417.

Fatti principali

L'articolo introduce una famiglia di funzioni di perdita surrogate per l'addestramento di modelli generativi.
La famiglia di perdite estende l'errore quadratico medio tra le probabilità logaritmiche target e del modello.
I gradienti on-policy delle nuove perdite corrispondono a quelli delle f-divergenze.
Off-policy, le perdite mantengono lo stesso minimizzatore globale.
Il lavoro stabilisce una corrispondenza biunivoca tra funzioni di perdita invarianti per traslazione e f-divergenze.
La famiglia di perdite può essere applicata a GFlowNet, modelli generativi e LLM.
L'articolo è pubblicato su arXiv con identificatore 2605.15417.
La ricerca consente nuove perdite surrogate per l'ottimizzazione di un'ampia classe di modelli generativi.

Nuova Famiglia di Perdite per l'Ottimizzazione di GFlowNet e LLM

Fatti principali

Entità

Istituzioni

Fonti