ARTFEED — Contemporary Art Intelligence

SCION: Orchestrazione Leggera di Politiche di Cache per Carichi di Lavoro Non Stazionari

other · 2026-05-06

SCION è un framework efficiente per orchestrare le politiche nelle cache di oggetti, progettato per ambienti di produzione eterogenei, dinamici e con limitazioni di throughput. Identifica le politiche di cache ottimali da una selezione limitata utilizzando un'impronta minima del carico di lavoro derivata dal percorso critico. Il prototipo AUTO sfrutta brevi statistiche di prefisso riguardanti dimensione degli oggetti, cacheabilità, riutilizzo e dimensioni della cache, impiegando un selettore lineare addestrato offline per distinguere tra GDSF, S3-FIFO, SIEVE, LHD, W-TinyLFU-AV e DynamicAdaptiveClimb. Una versione più semplice, SCION-P90, si basa esclusivamente su una soglia p90. In una valutazione solo CPU, basata su tracce, che coinvolge 30 tracce pubbliche di cache di oggetti e un sottoinsieme del simulatore HR-Cache, AUTO migliora i miss ratio per gli oggetti cacheabili. Questa ricerca affronta la sfida posta da politiche non ML semplici come SIEVE e S3-FIFO, che stabiliscono una base di riferimento formidabile, richiedendo che qualsiasi approccio appreso sia consapevole dell'overhead, resiliente alla deriva e competitivo con esperti competenti.

Fatti principali

  • SCION è un framework leggero di orchestrazione delle politiche per cache di oggetti.
  • Seleziona tra un piccolo insieme di politiche di cache implementabili utilizzando una minuscola impronta del carico di lavoro.
  • Il prototipo AUTO utilizza statistiche di prefisso brevi di dimensione degli oggetti, cacheabilità, riutilizzo e dimensione della cache.
  • AUTO applica un selettore lineare addestrato offline per scegliere tra GDSF, S3-FIFO, SIEVE, LHD, W-TinyLFU-AV e DynamicAdaptiveClimb.
  • La variante SCION-P90 utilizza solo una soglia p90.
  • La valutazione è stata solo CPU, basata su tracce su 30 tracce pubbliche di cache di oggetti e un sottoinsieme del simulatore HR-Cache.
  • AUTO migliora i miss ratio degli oggetti solo cacheabili.
  • Il lavoro affronta carichi di lavoro di produzione non stazionari e con vincoli di throughput.

Entità

Istituzioni

  • arXiv

Fonti