La tecnica Adaptive MSD-Splitting migliora gli algoritmi ad albero decisionale per dati asimmetrici
Una nuova tecnica computazionale denominata Adaptive MSD-Splitting (AMSD) è stata introdotta per potenziare gli algoritmi ad albero decisionale per attributi numerici continui. Questo metodo innovativo supera le carenze del tradizionale MSD-Splitting, che si basa su media empirica e deviazione standard per ottimizzare le prestazioni dell'algoritmo C4.5. Mentre il MSD-Splitting convenzionale è efficace per distribuzioni simmetriche, le sue rigide soglie di una deviazione standard possono causare una notevole perdita di informazioni in dataset fortemente asimmetrici tipici dei settori biomedico e finanziario. L'AMSD regola il moltiplicatore della deviazione standard in base all'asimmetria delle caratteristiche, affinando gli intervalli nelle aree dense per preservare il potere discriminativo. Questo approccio è stato incorporato nei metodi ensemble, migliorando in particolare le Random Forests. I risultati si basano su ricerche precedenti in arXiv:2604.19722v1, evidenziando la sfida della discretizzazione degli attributi continui nell'induzione degli alberi decisionali con l'aumentare delle dimensioni dei dataset. L'annuncio è stato condiviso tramite un abstract cross-type sulla piattaforma arXiv, mostrando la natura tecnica di questo avanzamento.
Fatti principali
- L'Adaptive MSD-Splitting (AMSD) migliora gli algoritmi ad albero decisionale
- Affronta le limitazioni della tecnica standard MSD-Splitting
- Regola dinamicamente il moltiplicatore della deviazione standard in base all'asimmetria delle caratteristiche
- Previene la perdita di informazioni in dataset biomedici e finanziari fortemente asimmetrici
- Migliora sia l'algoritmo C4.5 che i metodi ensemble Random Forests
- Restringe gli intervalli nelle regioni di dati dense per preservare la risoluzione discriminativa
- Si basa sulla ricerca documentata in arXiv:2604.19722v1
- Annunciato tramite abstract cross-type sulla piattaforma arXiv
Entità
Istituzioni
- arXiv