RAPT: Soglia Post-hoc Potenziata dal Recupero per la Classificazione Multi-etichetta

ai-technology · 2026-05-20

Esiste una nuova tecnica chiamata RAPT, che sta per Retrieval-Augmented Post-hoc Thresholding, che migliora il modo in cui vengono scelti i set di etichette nei sistemi di comprensione documentale multi-etichetta utilizzati in vari settori. La cosa interessante è che non richiede il riaddestramento del classificatore corrente. Questo approccio utilizza rappresentazioni documentali per trovare similarità e valuta i punteggi di confidenza per ogni etichetta. RAPT affronta problemi come errori OCR, distribuzione non uniforme delle etichette, numero variabile di etichette per istanza e diversi costi di errore che possono influenzare le soglie dei punteggi. Essendo implementato a posteriori, migliora l'accuratezza e riduce la necessità di verifica. Funziona con qualsiasi modello, inclusi encoder di apprendimento metrico e classificatori transformer finemente sintonizzati. Puoi consultare la ricerca su arXiv con l'ID 2605.16535.

Fatti principali

RAPT sta per Retrieval-Augmented Post-hoc Thresholding.
È progettato per pipeline di comprensione documentale multi-etichetta.
RAPT viene applicato post-hoc per migliorare la selezione del set di etichette.
Non richiede il riaddestramento del classificatore sottostante.
RAPT è agnostico rispetto al modello e funziona con qualsiasi predittore.
Affronta rumore OCR, squilibrio delle etichette e costi di errore asimmetrici.
Il metodo utilizza rappresentazioni documentali per la ricerca di similarità.
L'articolo è su arXiv con identificatore 2605.16535.

RAPT: Soglia Post-hoc Potenziata dal Recupero per la Classificazione Multi-etichetta

Fatti principali

Entità

Istituzioni

Fonti