Mode-as-Sequence: Nuovo quadro per la previsione del movimento multimodale
Un articolo di ricerca su arXiv propone Mode-as-Sequence, un quadro di decodifica unificato per la previsione del movimento multimodale. Il quadro traduce un insieme di modalità non ordinato in una sequenza di modalità ordinata, modellando esplicitamente la dipendenza tra modalità per affrontare il collasso delle modalità e la classificazione di affidabilità inaffidabile. Vengono sviluppate due istanziazioni: ModeSeq, che esegue la decodifica ricorrente delle modalità, e Parallel ModeSeq, che utilizza l'auto-attenzione mascherata per l'elaborazione parallela. L'articolo è disponibile su arXiv:2605.24037.
Fatti principali
- Articolo arXiv 2605.24037
- Quadro Mode-as-Sequence
- Previsione del movimento multimodale
- Collasso delle modalità affrontato
- Istanziazione ModeSeq
- Istanziazione Parallel ModeSeq
- Decodifica ricorrente delle modalità
- Auto-attenzione mascherata tra modalità
Entità
Istituzioni
- arXiv