TimeSRL: LLM ottimizzati con RL semantico per serie temporali nella salute mentale
Un nuovo framework LLM a due stadi, chiamato TimeSRL, è stato introdotto dai ricercatori per modellare il comportamento delle serie temporali, in particolare nella previsione della salute mentale. Inizialmente, il modello converte i dati grezzi dei sensori in linguaggio naturale di alto livello, successivamente prevede i risultati basandosi esclusivamente su queste astrazioni, stabilendo così un collo di bottiglia semantico che migliora la generalizzazione. Impiega l'ottimizzazione della politica relativa di gruppo (GRPO) combinata con l'apprendimento per rinforzo da ricompense verificabili (RLVR) per l'ottimizzazione end-to-end, eliminando la necessità di annotazioni intermedie gold standard. TimeSRL dimostra prestazioni superiori nei cambiamenti di distribuzione cross-dataset nei dati di rilevamento passivo longitudinale, superando sia il ML tradizionale che gli LLM standard. Questa ricerca è documentata nel preprint arXiv 2605.21295.
Fatti principali
- TimeSRL è un framework LLM a due stadi per la modellazione del comportamento delle serie temporali.
- Astrae i segnali grezzi in linguaggio naturale di alto livello prima della previsione.
- Ottimizzato usando GRPO con RLVR, nessuna necessità di annotazioni intermedie gold.
- Raggiunge prestazioni all'avanguardia nei compiti di previsione della salute mentale.
- Affronta i cambiamenti di distribuzione cross-dataset nel rilevamento passivo longitudinale.
- Pubblicato come arXiv:2605.21295.
- Il ML tradizionale si adatta eccessivamente agli artefatti specifici della coorte; gli LLM faticano con serie temporali eterogenee.
- Il collo di bottiglia semantico forza il ragionamento su concetti generalizzabili.
Entità
Istituzioni
- arXiv