ARTFEED — Contemporary Art Intelligence

IVF-TQ: Compressione Residua Senza Codebook per la Ricerca Vettoriale in Streaming

other · 2026-05-25

Un nuovo articolo su arXiv ha presentato IVF-TQ, un innovativo indice a file invertito per ricerche approssimate del vicino più prossimo, dotato di un layer di compressione residua indipendente dai dati. A differenza di metodi comuni come PQ, OPQ e ScaNN, che si basano sull'aggiustamento di un codebook su un dataset specifico e soffrono di un calo del recall all'aumentare dei database, IVF-TQ utilizza una rotazione casuale fissa insieme a un quantizzatore scalare di Lloyd-Max precalcolato che dipende solo dalla larghezza di bit b e dalla dimensione d. L'unica parte che richiede addestramento è la partizione k-means grossolana di IVF. Questo metodo fornisce un bound coerente dell'errore del prodotto interno sulla sfera, un vantaggio significativo rispetto agli approcci con codebook appreso. Esperimenti rivelano che la quantizzazione del prodotto può causare un calo del -3,8pp nel recall, evidenziando il problema che IVF-TQ affronta.

Fatti principali

  • IVF-TQ utilizza un layer di compressione residua indipendente dai dati
  • I metodi dominanti (PQ, OPQ, ScaNN) adattano un codebook a un campione iniziale
  • La quantizzazione del prodotto degrada il recall del -3,8pp con ingestione shuffled-i.i.d.
  • Layer di compressione: rotazione casuale fissa + quantizzatore scalare di Lloyd-Max
  • Solo la partizione k-means grossolana di IVF è addestrata
  • Il bound uniforme dell'errore del prodotto interno sulla sfera dipende da (b, d, delta)
  • L'articolo è su arXiv con ID 2605.17415
  • Il metodo è senza codebook

Entità

Istituzioni

  • arXiv

Fonti