Generazione consapevole dei confini decisionali per l'apprendimento a coda lunga
Un nuovo framework, Decision Boundary-aware Generation (DBG), affronta il bias dei dati a coda lunga nell'apprendimento automatico. I dataset a coda lunga distorcono i confini decisionali verso le classi di testa, riducendo l'accuratezza delle classi di coda. L'aumento generativo basato su diffusione e il trasferimento testa-coda sono stati utilizzati per mitigare questo problema, ma quest'ultimo può causare una miscelazione latente non locale delle caratteristiche, portando a sovrapposizione dei confini decisionali e spostamento della distribuzione delle classi di coda. DBG identifica questo problema di ambiguità dei confini e genera campioni informativi vicino ai confini per promuovere spazi decisionali separabili. Il framework ribilancia i dataset a coda lunga e migliora le prestazioni del classificatore. I risultati su benchmark standard a coda lunga mostrano miglioramenti consistenti.
Fatti principali
- Il bias dei dati a coda lunga distorce i confini decisionali verso le classi di testa e degrada l'accuratezza delle classi di coda.
- L'aumento generativo basato su diffusione affronta questo problema generando dati aggiuntivi.
- Il trasferimento testa-coda mitiga il bias del generatore ma induce una miscelazione latente non locale delle caratteristiche.
- La miscelazione delle caratteristiche causa sovrapposizione dei confini decisionali e spostamento della distribuzione delle classi di coda.
- Il framework DBG promuove l'apprendimento di rappresentazioni vicine ai confini.
- DBG genera campioni informativi vicino ai confini.
- DBG ribilancia i dataset a coda lunga producendo uno spazio decisionale più separabile.
- DBG viene valutato su benchmark standard a coda lunga.
Entità
—