Metodi di Imputazione dei Dati Mancanti: Una Revisione Sistematica

publication · 2026-04-27

Una revisione approfondita dei metodi per l'imputazione dei dati mancanti è stata pubblicata su arXiv, consolidando anni di ricerca frammentata proveniente da vari settori, tra cui sanità, bioinformatica, scienze sociali, e-commerce e monitoraggio industriale. Questo articolo approfondisce argomenti essenziali come i meccanismi di mancanza, la distinzione tra imputazione singola e multipla, e vari obiettivi di imputazione. Classifica tecniche che vanno dai metodi tradizionali come la regressione e l'algoritmo EM alle strategie contemporanee come il completamento di matrici a basso e alto rango, nonché approcci di deep learning (inclusi autoencoder, GAN e modelli di diffusione). La revisione cerca di collegare i principi statistici con gli ultimi sviluppi nel machine learning, evidenziando l'urgente necessità di un quadro integrato nella scienza dei dati.

Fatti principali

La revisione copre i metodi di imputazione dei dati mancanti in sanità, bioinformatica, scienze sociali, e-commerce e monitoraggio industriale.
Sintetizza la letteratura che era frammentata tra diversi campi.
I concetti chiave includono meccanismi di mancanza, imputazione singola vs. multipla e obiettivi di imputazione.
Tecniche classiche trattate: regressione, algoritmo EM.
Approcci moderni includono completamento di matrici a basso e alto rango, autoencoder, GAN e modelli di diffusione.
L'articolo collega le basi statistiche con i progressi del machine learning.
Pubblicato su arXiv con ID 2511.01196.
La revisione è interdisciplinare e trasversale ai compiti.

Metodi di Imputazione dei Dati Mancanti: Una Revisione Sistematica

Fatti principali

Entità

Istituzioni

Fonti