Generazione consapevole dei confini decisionali per l'apprendimento a coda lunga

other · 2026-05-06

Un nuovo framework, Decision Boundary-aware Generation (DBG), affronta il bias dei dati a coda lunga nell'apprendimento automatico. I dataset a coda lunga distorcono i confini decisionali verso le classi di testa, riducendo l'accuratezza delle classi di coda. L'aumento generativo basato su diffusione e il trasferimento testa-coda sono stati utilizzati per mitigare questo problema, ma quest'ultimo può causare una miscelazione latente non locale delle caratteristiche, portando a sovrapposizione dei confini decisionali e spostamento della distribuzione delle classi di coda. DBG identifica questo problema di ambiguità dei confini e genera campioni informativi vicino ai confini per promuovere spazi decisionali separabili. Il framework ribilancia i dataset a coda lunga e migliora le prestazioni del classificatore. I risultati su benchmark standard a coda lunga mostrano miglioramenti consistenti.

Fatti principali

Il bias dei dati a coda lunga distorce i confini decisionali verso le classi di testa e degrada l'accuratezza delle classi di coda.
L'aumento generativo basato su diffusione affronta questo problema generando dati aggiuntivi.
Il trasferimento testa-coda mitiga il bias del generatore ma induce una miscelazione latente non locale delle caratteristiche.
La miscelazione delle caratteristiche causa sovrapposizione dei confini decisionali e spostamento della distribuzione delle classi di coda.
Il framework DBG promuove l'apprendimento di rappresentazioni vicine ai confini.
DBG genera campioni informativi vicino ai confini.
DBG ribilancia i dataset a coda lunga producendo uno spazio decisionale più separabile.
DBG viene valutato su benchmark standard a coda lunga.

Entità

—

Fonti

arXiv cs.AI — 2026-05-05