SymbolicLight V1: Modello Linguistico Spike-Gated Raggiunge Alta Sparsità

ai-technology · 2026-05-22

SymbolicLight V1 è stato presentato dai ricercatori, caratterizzato da un modello linguistico a doppio percorso spike-gated che integra dinamiche binarie di spike Leaky Integrate-and-Fire insieme a un flusso residuo continuo. Il modulo innovativo Dual-Path SparseTCAM sostituisce la tradizionale attenzione densa con un'aggregazione a decadimento esponenziale per la memoria a lungo raggio e un meccanismo di attenzione locale spike-gated per la precisione a corto raggio. Una versione con 194 milioni di parametri, addestrata da zero su un dataset cinese-inglese di 3 miliardi di token, ha raggiunto una perplexity di validazione compresa tra 8.88 e 8.93 in quattro prove separate, mostrando oltre l'89% di sparsità di attivazione. Sebbene sia inferiore del 7.7% in perplexity rispetto a GPT-2 201M, supera GPT-2 124M. L'architettura presenta una testa di decodifica condizionata dal contesto e un tokenizer bilingue. Questa ricerca è stata pubblicata su arXiv.

Fatti principali

1. SymbolicLight V1 combina dinamiche binarie di spike LIF con un flusso residuo continuo.
2. Il modulo Dual-Path SparseTCAM sostituisce l'attenzione densa.
3. Modello con 194 milioni di parametri addestrato su un corpus cinese-inglese di 3 miliardi di token.
4. Perplexity di validazione compresa tra 8.88 e 8.93 in quattro esecuzioni.
5. Oltre l'89% di sparsità di attivazione per elemento.
6. Inferiore del 7.7% in PPL rispetto a GPT-2 201M.
7. Supera GPT-2 124M in PPL.
8. Pubblicato su arXiv con ID 2605.21333.

SymbolicLight V1: Modello Linguistico Spike-Gated Raggiunge Alta Sparsità

Fatti principali

Entità

Istituzioni

Fonti