Metodi di Imputazione dei Dati Mancanti: Una Revisione Sistematica
Una revisione approfondita dei metodi per l'imputazione dei dati mancanti è stata pubblicata su arXiv, consolidando anni di ricerca frammentata proveniente da vari settori, tra cui sanità, bioinformatica, scienze sociali, e-commerce e monitoraggio industriale. Questo articolo approfondisce argomenti essenziali come i meccanismi di mancanza, la distinzione tra imputazione singola e multipla, e vari obiettivi di imputazione. Classifica tecniche che vanno dai metodi tradizionali come la regressione e l'algoritmo EM alle strategie contemporanee come il completamento di matrici a basso e alto rango, nonché approcci di deep learning (inclusi autoencoder, GAN e modelli di diffusione). La revisione cerca di collegare i principi statistici con gli ultimi sviluppi nel machine learning, evidenziando l'urgente necessità di un quadro integrato nella scienza dei dati.
Fatti principali
- La revisione copre i metodi di imputazione dei dati mancanti in sanità, bioinformatica, scienze sociali, e-commerce e monitoraggio industriale.
- Sintetizza la letteratura che era frammentata tra diversi campi.
- I concetti chiave includono meccanismi di mancanza, imputazione singola vs. multipla e obiettivi di imputazione.
- Tecniche classiche trattate: regressione, algoritmo EM.
- Approcci moderni includono completamento di matrici a basso e alto rango, autoencoder, GAN e modelli di diffusione.
- L'articolo collega le basi statistiche con i progressi del machine learning.
- Pubblicato su arXiv con ID 2511.01196.
- La revisione è interdisciplinare e trasversale ai compiti.
Entità
Istituzioni
- arXiv