ARTFEED — Contemporary Art Intelligence

Nuova Famiglia di Perdite per l'Ottimizzazione di GFlowNet e LLM

other · 2026-05-18

È stato pubblicato uno studio che presenta una collezione di funzioni di perdita surrogate per l'addestramento di modelli generativi, come GFlowNet e grandi modelli linguistici (LLM). I ricercatori dimostrano che l'errore quadratico medio, che misura la differenza tra le probabilità logaritmiche target e del modello ed è stato una perdita efficace a bassa varianza, può essere generalizzato per comprendere l'intero insieme delle f-divergenze. Questa famiglia innovativa di perdite presenta la caratteristica che, quando valutata on-policy, i loro gradienti si allineano con quelli della rispettiva f-divergenza, mantenendo lo stesso minimizzatore globale off-policy. La ricerca stabilisce un collegamento diretto tra funzioni di perdita invarianti per traslazione sulle probabilità logaritmiche e f-divergenze, facilitando la creazione di nuove perdite surrogate per ottimizzare vari modelli generativi. L'articolo è disponibile su arXiv con identificatore 2605.15417.

Fatti principali

  • L'articolo introduce una famiglia di funzioni di perdita surrogate per l'addestramento di modelli generativi.
  • La famiglia di perdite estende l'errore quadratico medio tra le probabilità logaritmiche target e del modello.
  • I gradienti on-policy delle nuove perdite corrispondono a quelli delle f-divergenze.
  • Off-policy, le perdite mantengono lo stesso minimizzatore globale.
  • Il lavoro stabilisce una corrispondenza biunivoca tra funzioni di perdita invarianti per traslazione e f-divergenze.
  • La famiglia di perdite può essere applicata a GFlowNet, modelli generativi e LLM.
  • L'articolo è pubblicato su arXiv con identificatore 2605.15417.
  • La ricerca consente nuove perdite surrogate per l'ottimizzazione di un'ampia classe di modelli generativi.

Entità

Istituzioni

  • arXiv

Fonti