SilverTorch di Meta unifica il recupero delle raccomandazioni in un'unica rete neurale
Meta ha presentato SilverTorch, un nuovo sistema di raccomandazione che sostituisce il tradizionale recupero basato su microservizi con un'architettura neurale unificata chiamata Index as Model. Il sistema consolida tutti i componenti di recupero—ricerca approssimata del vicino più prossimo, filtraggio di idoneità, riordinamento neurale e scoring multi-task—in un unico modello PyTorch. In una valutazione su 80 milioni di elementi, SilverTorch ha raggiunto una produttività 23,7× superiore e un'efficienza dei costi di calcolo 20,9× migliore rispetto ai basati su CPU, migliorando anche la qualità delle raccomandazioni. L'articolo di ricerca è stato accettato come full paper a SIGIR 2026. SilverTorch è già implementato nelle app della famiglia Meta, tra cui Facebook, Instagram e Threads, ed è progettato per integrare modelli linguistici di grandi dimensioni come moduli aggiuntivi. Il sistema utilizza aggiornamenti in streaming per la freschezza dell'indice, consentendo ai post dello stesso giorno di costituire una parte significativa delle raccomandazioni. Le innovazioni tecniche chiave includono un kernel di ricerca ANN Int8 fuso e un filtro Bloom index, entrambi reimplementati in puro PyTorch per sfruttare il parallelismo della GPU.
Fatti principali
- SilverTorch unifica tutti i componenti di recupero in un'unica rete neurale sotto il paradigma Index as Model.
- Raggiunge una produttività fino a 23,7× superiore e un'efficienza dei costi di calcolo 20,9× migliore rispetto alla baseline CPU.
- Accettato come full paper di ricerca a SIGIR 2026.
- Implementato nelle app di Meta: Facebook, Instagram, Threads.
- Utilizza aggiornamenti in streaming per la freschezza dell'indice quasi in tempo reale.
- Le innovazioni chiave sono la ricerca ANN Int8 fusa e il filtro Bloom index.
- Supporta il riordinamento neurale e lo scoring multi-task all'interno della fase di recupero.
- Progettato per integrare LLM come moduli aggiuntivi nello stesso modello.
Entità
Istituzioni
- Meta
- Threads
- SIGIR 2026
- PyTorch
- TorchRec
- FAISS
Luoghi
- Menlo Park
- United States