ARTFEED — Contemporary Art Intelligence

Quantizzazione Tail-Aware HiFloat4 per Wan2.2 Text-to-Video

ai-technology · 2026-05-27

Un nuovo metodo di quantizzazione chiamato Tail-Aware HiFloat4 è stato sviluppato per il modello di generazione testo-video Wan2.2. L'approccio adatta la pipeline di quantizzazione post-addestramento ViDiT-Q per utilizzare il formato numerico HiFloat4, quantizzando i principali strati lineari nei moduli transformer di Wan2.2 con quantizzazione fittizia W4A4, mantenendo i moduli di confine in alta precisione. Un modulo di calibrazione percentile consapevole della coda di attivazione costruisce maschere di canale per ridurre l'impatto di rari outlier di calibrazione. Il metodo mantiene invariati l'aritmetica HiFloat4 in esecuzione e la pipeline di campionamento. Questo lavoro è stato presentato alla sfida di quantizzazione per la generazione testo-video a bassi bit ed è descritto in un rapporto su arXiv.

Fatti principali

  • Metodo: Tail-Aware HiFloat4
  • Presentato alla sfida di quantizzazione per la generazione testo-video a bassi bit
  • Adatta la pipeline ViDiT-Q a Wan2.2
  • Utilizza il formato numerico HiFloat4
  • Quantizza i principali strati lineari con quantizzazione fittizia W4A4
  • Mantiene i moduli di confine in alta precisione
  • Introduce calibrazione percentile consapevole della coda di attivazione per maschere di canale
  • Include ripristino compatto dello stato PTQ

Entità

Istituzioni

  • arXiv

Fonti