DiRe-RAPIDS: Riduzione della dimensionalità fedele alla topologia su larga scala
Una nuova tecnica per la riduzione della dimensionalità, chiamata DiRe-RAPIDS, supera UMAP nel mantenere l'integrità topologica raggiungendo velocità di elaborazione simili. Questo approccio corregge una limitazione delle metriche locali convenzionali che tendono a favorire la memorizzazione del rumore, con conseguente creazione di cicli fittizi e cluster isolati. DiRe è ottimizzato rispetto a un benchmark incentrato sulla fedeltà topologica utilizzando varietà rumorose con omologia stabilita, ottenendo risultati Pareto-ottimali che eguagliano o superano le prestazioni di UMAP accelerato su GPU nei compiti di classificazione e recupera accuratamente i primi numeri di Betti durante le valutazioni di stress. Su 723K embedding di articoli arXiv, DiRe conserva 3-4 volte più struttura topologica di UMAP entro vincoli di tempo simili. Questa ricerca è disponibile su arXiv nei campi dell'informatica e dell'apprendimento automatico.
Fatti principali
- 1. DiRe-RAPIDS è un nuovo metodo di riduzione della dimensionalità.
- 2. Preserva la struttura topologica meglio di UMAP.
- 3. Le metriche locali standard premiano la memorizzazione del rumore.
- 4. UMAP può inventare cicli e isole disconnesse.
- 5. DiRe utilizza un benchmark di fedeltà topologica con varietà rumorose.
- 6. DiRe eguaglia o supera UMAP accelerato su GPU nella classificazione.
- 7. DiRe recupera i primi numeri di Betti esatti nei test di stress.
- 8. Testato su 723K embedding di articoli arXiv.
- 9. DiRe preserva 3-4 volte più struttura topologica di UMAP.
- 10. Pubblicato su arXiv nei campi dell'informatica e dell'apprendimento automatico.
Entità
Istituzioni
- arXiv