CAPS: Ragionamento Parallelo Efficiente tramite Selezione Adattativa a Coppie
Un nuovo framework noto come CAPS (Cascaded Adaptive Pairwise Selection) mira a ridurre le richieste computazionali della verifica a coppie nei modelli linguistici estesi. A differenza delle tecniche convenzionali che effettuano numerose valutazioni a coppie complete senza considerare la loro rilevanza, CAPS impiega una distribuzione non uniforme delle risorse del verificatore lungo due dimensioni: un asse di evidenza che determina l'estensione di ciascun candidato vista dal giudice, e un asse di distribuzione che gestisce come i confronti sono allocati tra i candidati. Questo framework presenta una cascata a quattro stadi e include una subroutine di salvataggio opzionale, fornendo un costo token-verificatore in forma chiusa per ciascun candidato. La ricerca è disponibile su arXiv con l'identificatore 2605.15513.
Fatti principali
- CAPS sta per Cascaded Adaptive Pairwise Selection.
- È un framework solo per inferenza per il ragionamento parallelo nei LLM.
- Affronta l'alto costo della verifica a coppie.
- L'allocazione del calcolo è non uniforme lungo gli assi di evidenza e distribuzione.
- Il framework utilizza una cascata a quattro stadi con una subroutine di salvataggio opzionale.
- Ammette un costo token-verificatore in forma chiusa per candidato.
- L'articolo è su arXiv: 2605.15513.
- Il metodo mira a migliorare l'efficienza del scaling a tempo di test.
Entità
Istituzioni
- arXiv