BuddyBench: Benchmark multi-task per la comunicazione sociale pediatrica
BuddyBench è un benchmark multi-task che privilegia la privacy, specificamente progettato per personalizzare la comunicazione sociale pediatrica. Combina percorsi di apprendimento a livello di esercizio, valutazioni cliniche standardizzate, auto-segnalazioni BuddyPlan e risultati di trattamenti randomizzati in un quadro coerente, distinguendosi dagli attuali database neuroevolutivi che enfatizzano imaging, genetica o fenotipizzazione trasversale. Il benchmark è composto da due gruppi: ND-03, una coorte osservazionale con ampia copertura di esercizi per i Compiti 1-2 (n=189), e ND-02, una coorte di trial controllato randomizzato per i Compiti 3-4 (n=86 ITT). Queste coorti facilitano il tracciamento della conoscenza, suggerimenti per il prossimo esercizio, previsioni cliniche e inferenza causale, collegando la personalizzazione comportamentale con la valutazione clinica. Inoltre, BuddyBench-Sim, un dataset sintetico, è fornito per una valutazione coerente, con baseline che mostrano efficacia in tutti i compiti garantendo al contempo la privacy pediatrica.
Fatti principali
- BuddyBench è un benchmark multi-task vincolato alla privacy per la personalizzazione della comunicazione sociale pediatrica.
- Collega traiettorie di apprendimento a livello di esercizio, valutazioni cliniche, auto-segnalazioni BuddyPlan e endpoint di trattamento randomizzato.
- Due coorti: ND-03 (osservazionale, n=189) e ND-02 (RCT, n=86 ITT).
- Supporta tracciamento della conoscenza, raccomandazione del prossimo esercizio, previsione clinica e inferenza causale.
- BuddyBench-Sim è un dataset sintetico complementare per una valutazione riproducibile.
- Le baseline mostrano segnale in tutti i compiti rispettando i vincoli di privacy pediatrica.
- Pubblicato su arXiv con ID 2605.28089.
- Tipo di annuncio: nuovo.
Entità
Istituzioni
- arXiv