ELSA: Un'architettura Near-SRAM per l'Inferenza Elastica nelle SNN
Un nuovo articolo su arXiv (2605.20802) introduce ELSA, un'architettura di dataflow near-SRAM progettata per consentire una vera inferenza elastica nelle reti neurali spike (SNN). Le SNN offrono un calcolo event-driven e basato solo su addizioni per una maggiore efficienza, e la loro proprietà di inferenza elastica consente ai risultati di emergere progressivamente, permettendo risposte anticipate a input salienti. Tuttavia, gli acceleratori SNN esistenti, sia layer-by-layer che time-step-by-time-step, non possono sfruttare questa proprietà a causa di pipeline a grana grossa che ritardano l'inoltro delle uscite. ELSA supera questo problema con una pipeline fine-grained a spine/token e ottimizzazioni hardware, consentendo l'inoltro immediato dei risultati. L'architettura è progettata per l'integrazione near-SRAM, con l'obiettivo di realizzare tutti i vantaggi dell'inferenza elastica nel calcolo neuromorfico.
Fatti principali
- ELSA è un'architettura di dataflow near-SRAM per l'inferenza SNN.
- Consente una vera inferenza elastica attraverso una pipeline fine-grained a spine/token.
- Gli acceleratori SNN esistenti utilizzano progetti layer-by-layer o time-step-by-time-step.
- Questi progetti ritardano l'inoltro delle uscite e perdono i vantaggi dell'inferenza elastica.
- ELSA permette l'inoltro immediato dei risultati per risposte anticipate.
- L'articolo è disponibile su arXiv con ID 2605.20802.
- Le SNN sfruttano il calcolo event-driven e basato solo su addizioni.
- L'inferenza elastica consente ai risultati di emergere progressivamente.
Entità
Istituzioni
- arXiv