PrismQuant: Quantizzazione vettoriale ottimale per il rapporto distorsione/velocità per sorgenti a miscela gaussiana
Un recente preprint su arXiv (2605.15507) presenta PrismQuant, un framework per la quantizzazione vettoriale che affronta in modo ottimale il rapporto distorsione/velocità per sorgenti a miscela gaussiana. La codifica per trasformazione tradizionale, che eccelle con sorgenti gaussiane unimodali quando si utilizza MSE, risulta insufficiente per sorgenti multimodali, poiché una singola covarianza non riesce a rappresentare geometrie locali diverse. Gli autori dimostrano che la struttura a miscela comporta solo un costo legato all'etichettatura dei componenti, mentre la funzione RD condizionale assistita da un genio è determinata da un livello globale unificato di reverse-waterfilling applicabile a tutti i componenti e modi propri. Basandosi su questa scoperta, PrismQuant raggiunge una quantizzazione ottimale.
Fatti principali
- Preprint arXiv 2605.15507
- Titolo: PrismQuant: Quantizzazione vettoriale ottimale per il rapporto distorsione/velocità per sorgenti a miscela gaussiana
- La codifica per trasformazione classica è RD-ottimale per sorgenti gaussiane sotto MSE
- KLT diagonalizza la covarianza, il reverse-waterfilling alloca i bit
- Le sorgenti multimodali rompono la storia classica
- Le sorgenti a miscela gaussiana vengono rivisitate
- La struttura a miscela comporta solo un costo di etichettatura dei componenti
- La funzione RD condizionale assistita da un genio utilizza un singolo livello globale di reverse-waterfilling
Entità
Istituzioni
- arXiv