HiLight: Potenziare il Ragionamento dei LLM tramite Evidenziazione
Un nuovo framework chiamato HiLight migliora il ragionamento dei modelli linguistici di grandi dimensioni (LLM) enfatizzando le prove chiave in contesti lunghi e rumorosi senza modificare il modello o l'input. Sviluppato da ricercatori, HiLight utilizza un Attore di Enfasi leggero addestrato con apprendimento per rinforzo per inserire tag di evidenziazione minimi attorno a porzioni cruciali. Il risolutore LLM congelato esegue quindi il ragionamento a valle sull'input evidenziato. Questo approccio evita compressioni o riscritture che potrebbero scartare o distorcere le prove. HiLight supera forti baseline in compiti di raccomandazione sequenziale e risposta a domande su contesti lunghi. Il metodo non richiede etichette di prova né accesso agli interni del risolutore.
Fatti principali
- HiLight è un framework di Enfasi delle Prove per LLM congelati.
- Separa la selezione delle prove dal ragionamento.
- Un Attore di Enfasi leggero inserisce tag di evidenziazione attorno a porzioni cruciali.
- L'addestramento utilizza l'apprendimento per rinforzo con solo la ricompensa del compito del risolutore.
- Non sono necessarie etichette di prova né modifiche al risolutore.
- HiLight migliora le prestazioni rispetto alle baseline basate su prompt e ottimizzazione automatica dei prompt.
- Testato su raccomandazione sequenziale e risposta a domande su contesti lunghi.
- Pubblicato su arXiv con ID 2604.22565.
Entità
Istituzioni
- arXiv