ARTFEED — Contemporary Art Intelligence

BuddyBench: Benchmark multi-task per la comunicazione sociale pediatrica

other · 2026-05-28

BuddyBench è un benchmark multi-task che privilegia la privacy, specificamente progettato per personalizzare la comunicazione sociale pediatrica. Combina percorsi di apprendimento a livello di esercizio, valutazioni cliniche standardizzate, auto-segnalazioni BuddyPlan e risultati di trattamenti randomizzati in un quadro coerente, distinguendosi dagli attuali database neuroevolutivi che enfatizzano imaging, genetica o fenotipizzazione trasversale. Il benchmark è composto da due gruppi: ND-03, una coorte osservazionale con ampia copertura di esercizi per i Compiti 1-2 (n=189), e ND-02, una coorte di trial controllato randomizzato per i Compiti 3-4 (n=86 ITT). Queste coorti facilitano il tracciamento della conoscenza, suggerimenti per il prossimo esercizio, previsioni cliniche e inferenza causale, collegando la personalizzazione comportamentale con la valutazione clinica. Inoltre, BuddyBench-Sim, un dataset sintetico, è fornito per una valutazione coerente, con baseline che mostrano efficacia in tutti i compiti garantendo al contempo la privacy pediatrica.

Fatti principali

  • BuddyBench è un benchmark multi-task vincolato alla privacy per la personalizzazione della comunicazione sociale pediatrica.
  • Collega traiettorie di apprendimento a livello di esercizio, valutazioni cliniche, auto-segnalazioni BuddyPlan e endpoint di trattamento randomizzato.
  • Due coorti: ND-03 (osservazionale, n=189) e ND-02 (RCT, n=86 ITT).
  • Supporta tracciamento della conoscenza, raccomandazione del prossimo esercizio, previsione clinica e inferenza causale.
  • BuddyBench-Sim è un dataset sintetico complementare per una valutazione riproducibile.
  • Le baseline mostrano segnale in tutti i compiti rispettando i vincoli di privacy pediatrica.
  • Pubblicato su arXiv con ID 2605.28089.
  • Tipo di annuncio: nuovo.

Entità

Istituzioni

  • arXiv

Fonti