ARTFEED — Contemporary Art Intelligence

Flash PD-SSM: Modelli a Spazio di Stato Sparsi Strutturati Ottimizzati per la Memoria

ai-technology · 2026-05-20

Viene proposto un nuovo modello a spazio di stato (SSM) chiamato Flash PD-SSM per affrontare il compromesso tra efficienza ed espressività. Le matrici di transizione non strutturate offrono la massima espressività ma sono computazionalmente costose, mentre le matrici strutturate sono efficienti ma limitate. Flash PD-SSM utilizza un insieme addestrabile di matrici sparse strutturate, con una selezionata discretamente per passo temporale, raggiungendo un'espressività FSA paragonabile a quella delle matrici non strutturate, mantenendo l'efficienza. Il modello si basa su lavori recenti sugli SSM sparsi strutturati e offre un throughput comparabile agli SSM strutturati ampiamente utilizzati, con migliori garanzie di espressività.

Fatti principali

  • Flash PD-SSM è un nuovo modello a spazio di stato.
  • Utilizza matrici sparse strutturate selezionate discretamente per passo temporale.
  • Raggiunge un'espressività FSA al livello delle matrici non strutturate.
  • Mantiene un'efficienza paragonabile agli SSM strutturati ampiamente utilizzati.
  • Affronta il compromesso tra efficienza ed espressività negli SSM.
  • Si basa su lavori recenti sugli SSM sparsi strutturati.
  • Le matrici non strutturate hanno un costo computazionale e di memoria elevato.
  • Le matrici strutturate sono efficienti ma limitate in espressività.

Entità

Fonti