TabPFN supera i modelli classici nella previsione dell'anemia tra paesi
Un nuovo studio esamina le prestazioni dei modelli di fondamento tabulari basati su transformer nella previsione dell'anemia infantile rispetto ai metodi supervisionati standard, specialmente con dati limitati in diversi paesi. La ricerca ha analizzato i dati DHS di 16 paesi in Africa, Asia, America Latina, Caucaso e Medio Oriente, coinvolgendo 68.856 campioni. Sono stati valutati metodi come Regressione Logistica, XGBoost, LightGBM e TabPFN v2.6, utilizzando metriche come AUC-ROC e Brier score, e testata la generalizzazione attraverso vari approcci. I fattori chiave esaminati includevano sesso, età, residenza, istruzione materna e ricchezza, con l'importanza delle caratteristiche valutata tramite SHAP. In particolare, TabPFN ha superato gli altri in scenari con pochi dati, raggiungendo un impressionante Brier score di 0,042, evidenziando la sua promessa per le sfide sanitarie globali.
Fatti principali
- L'anemia infantile colpisce circa il 40% dei bambini di età compresa tra 6 e 59 mesi a livello globale.
- Dati provenienti da 16 paesi in Africa, Asia, America Latina, Caucaso e Medio Oriente (n=68.856).
- Modelli confrontati: Regressione Logistica, XGBoost, LightGBM e TabPFN v2.6.
- Metriche di performance: AUC-ROC, Brier score, ECE.
- Generalizzazione valutata utilizzando LOCO, reverse-LOCO e impostazioni few-shot.
- Analisi di sottogruppi includevano sesso, età, residenza, istruzione materna, ricchezza.
- Importanza delle caratteristiche stimata tramite SHAP.
- TabPFN ha superato i modelli classici in regimi con pochi dati (<200 campioni).
- TabPFN ha ottenuto il Brier score più basso (0,042) tra i paesi.
Entità
Luoghi
- Africa
- Asia
- Latin America
- Caucasus
- Middle East