RAPT: Soglia Post-hoc Potenziata dal Recupero per la Classificazione Multi-etichetta
Esiste una nuova tecnica chiamata RAPT, che sta per Retrieval-Augmented Post-hoc Thresholding, che migliora il modo in cui vengono scelti i set di etichette nei sistemi di comprensione documentale multi-etichetta utilizzati in vari settori. La cosa interessante è che non richiede il riaddestramento del classificatore corrente. Questo approccio utilizza rappresentazioni documentali per trovare similarità e valuta i punteggi di confidenza per ogni etichetta. RAPT affronta problemi come errori OCR, distribuzione non uniforme delle etichette, numero variabile di etichette per istanza e diversi costi di errore che possono influenzare le soglie dei punteggi. Essendo implementato a posteriori, migliora l'accuratezza e riduce la necessità di verifica. Funziona con qualsiasi modello, inclusi encoder di apprendimento metrico e classificatori transformer finemente sintonizzati. Puoi consultare la ricerca su arXiv con l'ID 2605.16535.
Fatti principali
- RAPT sta per Retrieval-Augmented Post-hoc Thresholding.
- È progettato per pipeline di comprensione documentale multi-etichetta.
- RAPT viene applicato post-hoc per migliorare la selezione del set di etichette.
- Non richiede il riaddestramento del classificatore sottostante.
- RAPT è agnostico rispetto al modello e funziona con qualsiasi predittore.
- Affronta rumore OCR, squilibrio delle etichette e costi di errore asimmetrici.
- Il metodo utilizza rappresentazioni documentali per la ricerca di similarità.
- L'articolo è su arXiv con identificatore 2605.16535.
Entità
Istituzioni
- arXiv