Previsione della posa umana a breve termine condizionata dalle emozioni con un modello predittivo leggero del mondo
Un articolo di ricerca su arXiv (2604.23532) propone un modello predittivo del mondo autoregressivo leggero per la previsione a breve termine della posa umana che incorpora embedding emotivi derivati dalle espressioni facciali. Il modello utilizza un meccanismo di gating apprendibile per combinare i keypoint della posa con i segnali emotivi e effettua previsioni a rotazione di 15 passi tramite un'architettura LSTM a due strati. Gli esperimenti sono stati condotti su dataset video di posa-emozione su piccola scala. Il lavoro affronta la lacuna nei modelli attuali di previsione della traiettoria che si basano esclusivamente su segnali geometrici e ignorano i segnali emotivi che influenzano la dinamica del movimento umano.
Fatti principali
- Articolo pubblicato su arXiv con ID 2604.23532
- Propone la previsione della posa umana a breve termine condizionata dalle emozioni
- Utilizza embedding emotivi derivati dalle espressioni facciali come segnali condizionali
- Modello predittivo del mondo autoregressivo leggero con previsione a rotazione di 15 passi
- Combina keypoint della posa e embedding emotivi tramite un meccanismo di gating apprendibile
- Basato su architettura LSTM a due strati
- Esperimenti su dataset video di posa-emozione su piccola scala
- Affronta la limitazione dei modelli attuali che trascurano i segnali emotivi
Entità
Istituzioni
- arXiv