ARTFEED — Contemporary Art Intelligence

Il framework CARV riduce la varianza nelle pipeline di insegnamento dei modelli diffusivi

ai-technology · 2026-05-22

Un nuovo framework chiamato CARV (Compute-Aware Variance Accounting) mira a ridurre la varianza degli stimatori nelle pipeline che utilizzano modelli diffusivi preaddestrati come insegnanti congelati, come la generazione text-to-3D, la distillazione a singolo passo e l'attribuzione dei dati. Queste pipeline si basano su aspettative Monte Carlo sui livelli di rumore e sui campioni di rumore gaussiano, dove ogni estrazione richiede costosi calcoli a monte come rendering, simulazione o codifica. CARV introduce uno stimatore Monte Carlo gerarchico che ammortizza i costosi calcoli a monte su ricampionamenti economici del rumore di diffusione, migliorato dal campionamento per importanza dei timestep e da una costruzione stratified-inverse-CDF. Esperimenti nella distillazione text-to-3D e nell'attribuzione mostrano che CARV fornisce moltiplicatori di calcolo effettivi di 2-3x, con la maggior parte dei guadagni dal riutilizzo ammortizzato e circa il 25% aggiuntivo dal campionamento per importanza e dalla stratificazione. Nella distillazione a singolo passo, le stesse tecniche riducono significativamente la varianza del gradiente. Il framework non modifica la funzione obiettivo. Il paper è disponibile su arXiv con ID 2605.21489.

Fatti principali

  • CARV è un framework di contabilità della varianza consapevole del calcolo per pipeline di insegnamento dei modelli diffusivi.
  • Si rivolge a compiti di text-to-3D, distillazione a singolo passo e attribuzione dei dati.
  • Utilizza uno stimatore Monte Carlo gerarchico con riutilizzo ammortizzato e campionamento per importanza dei timestep.
  • La costruzione stratified-inverse-CDF fa parte del metodo.
  • Gli esperimenti mostrano moltiplicatori di calcolo effettivi di 2-3x nella distillazione text-to-3D e nell'attribuzione.
  • Circa il 25% dei guadagni proviene dal campionamento per importanza e dalla stratificazione.
  • La distillazione a singolo passo vede una significativa riduzione della varianza del gradiente.
  • Il framework non altera la funzione obiettivo.

Entità

Istituzioni

  • arXiv

Fonti