MambaGaze: Framework AI per la valutazione del carico cognitivo tramite eye-tracking
Un gruppo di ricercatori ha presentato MambaGaze, un framework innovativo che valuta il carico cognitivo in tempo reale utilizzando dati di eye-tracking. Affronta sfide come la perdita di dati dovuta a battiti di ciglia e imprecisioni nel tracciamento. Il framework incorpora la codifica XMD per gestire l'incertezza dei dati e impiega il modello bidirezionale Mamba-2 per comprendere le relazioni temporali a lungo termine. Nei test con i dataset CLARE e CL-Drive, MambaGaze ha raggiunto tassi di accuratezza del 76,8% e 73,1%, superando CNN, Transformer, ResNet e VGG di 4-12 punti percentuali. Inoltre, i test su NVIDIA Jetson mostrano il suo potenziale per applicazioni critiche di sicurezza, come il monitoraggio dell'attenzione del conducente e il supporto ai cockpit automatizzati.
Fatti principali
- MambaGaze è un framework per la valutazione del carico cognitivo da dati di eye-tracking.
- Utilizza la codifica XMD per gestire i dati mancanti dovuti a battiti di ciglia e fallimenti di tracciamento.
- Mamba-2 bidirezionale cattura le dipendenze temporali con complessità lineare.
- Ha raggiunto un'accuratezza del 76,8% sul dataset CLARE e del 73,1% sul dataset CL-Drive.
- Supera le baseline CNN, Transformer, ResNet e VGG di 4-12 punti percentuali.
- Benchmark di deployment edge condotti su NVIDIA Jetson.
- Le potenziali applicazioni includono il monitoraggio della vigilanza del conducente e l'assistenza ai cockpit automatizzati.
- L'articolo è disponibile su arXiv con ID 2605.22775.
Entità
Istituzioni
- arXiv
- NVIDIA