Algoritmo CITE per Inferenza Sempre Valida nell'Autoconsistenza dei LLM
Un nuovo approccio statistico noto come Certification by Intersection-union Testing with E-processes (CITE) facilita la certificazione sempre valida di una risposta target come modalità distinta della distribuzione delle risposte di un grande modello linguistico. Questo algoritmo gestisce efficacemente la falsa certificazione a qualsiasi livello specificato, indipendentemente dall'arresto arbitrario basato sui dati, e non richiede conoscenza preliminare dell'insieme delle categorie di risposta. Inoltre, offre un tasso di arresto indipendente dalla dimensione dell'insieme delle categorie e si allinea con i limiti inferiori minimax corrispondenti, soggetti a costanti nel regime primario. I risultati sono dettagliati in arXiv:2605.05873.
Fatti principali
- CITE sta per Certification by Intersection-union Testing with E-processes
- Fornisce inferenza statistica sempre valida per l'autoconsistenza dei LLM
- Controlla la falsa certificazione a qualsiasi livello prescritto
- Non richiede conoscenza preliminare dell'insieme delle categorie di risposta
- Dimostra un tasso di arresto indipendente dalla dimensione dell'insieme delle categorie
- Stabilisce limiti inferiori minimax corrispondenti fino a costanti
- L'obiettivo è certificare una risposta pre-specificata come modalità unica della distribuzione delle risposte
- Pubblicato su arXiv con ID 2605.05873
Entità
Istituzioni
- arXiv