PCFJudge riduce la sensibilità all'ordine nella valutazione della factualità degli LLM
Un nuovo metodo chiamato PCFJudge affronta la sensibilità all'ordine dei candidati nella valutazione della factualità lista per lista da parte dei grandi modelli linguistici (LLM). La tecnica riesegue lo stesso prompt di factualità su più ordinamenti di insiemi di candidati e aggrega punteggi, classifiche e segnali di incertezza in una decisione di consenso. Su RewardBench 2 Factuality, PCFJudge migliora l'accuratezza fino a 7 punti assoluti rispetto alla valutazione diretta. Le ablazioni di sviluppo rivelano che il consenso di permutazione stesso, piuttosto che strati di arbitraggio più pesanti, guida il miglioramento. La ricerca suggerisce che una parte significativa dell'errore di giudizio sulla factualità deriva dall'instabilità dell'ordine.
Fatti principali
- PCFJudge è un metodo a tempo di inferenza per la valutazione della factualità degli LLM.
- Riesegue lo stesso prompt su più ordinamenti di insiemi di candidati.
- Aggrega punteggi, classifiche e segnali di incertezza in un consenso.
- Migliora rispetto alla valutazione diretta fino a 7 punti assoluti su RewardBench 2 Factuality.
- Il consenso di permutazione è la fonte dominante del guadagno.
- L'instabilità dell'ordine contribuisce in modo significativo all'errore di giudizio sulla factualità.
- Il metodo affronta la sensibilità all'ordine dei candidati nella valutazione lista per lista.
- La ricerca è pubblicata su arXiv con ID 2603.20562.
Entità
Istituzioni
- arXiv