Quadro di Calibrazione per la Classificazione Probabilistica di Etichette

other · 2026-06-01

Un nuovo studio formalizza la calibrazione per la classificazione probabilistica di etichette, un compito in cui i modelli prevedono distribuzioni su ordinamenti di un insieme di etichette. Gli autori definiscono una gerarchia di nozioni di calibrazione che coprono classificazioni complete, sottoclassificazioni e classificazioni top-k, dimostrando che la calibrazione completa implica le altre ma non viceversa, e che la calibrazione per sottoclassificazioni e top-k sono incomparabili. Test empirici mostrano che i modelli popolari di classificazione di etichette sono spesso scarsamente calibrati, con discrepanze significative tra le metriche di sottoclassificazione e top-k. Il quadro viene applicato ai modelli di ricompensa RLHF, rivelando problemi di calibrazione nell'apprendimento delle preferenze.

Fatti principali

La calibrazione allinea le probabilità previste con le frequenze reali degli esiti.
La classificazione di etichette prevede una distribuzione sugli ordinamenti di un insieme di etichette.
La calibrazione completa implica la calibrazione per sottoclassificazioni e top-k.
La calibrazione per sottoclassificazioni e top-k sono incomparabili.
I modelli popolari di classificazione di etichette sono spesso scarsamente calibrati.
Esistono differenze sostanziali tra le metriche di sottoclassificazione e top-k.
Il quadro viene applicato ai modelli di ricompensa RLHF.
Lo studio è pubblicato su arXiv con ID 2605.30447.

Entità

—

Fonti

arXiv cs.AI — 2026-06-01