LOVER: Un verificatore non supervisionato potenzia il ragionamento dei LLM tramite regole logiche
I ricercatori propongono LOVER, un verificatore non supervisionato che utilizza regole logiche per migliorare il ragionamento nei grandi modelli linguistici senza costosi dati supervisionati. Il metodo tratta il verificatore come una variabile latente binaria, applicando vincoli di consistenza di negazione, intra-gruppo e inter-gruppo su più percorsi di ragionamento. Esperimenti su 10 dataset mostrano che LOVER raggiunge il 95% delle prestazioni di un verificatore supervisionato. Il codice è open-source.
Fatti principali
- LOVER è un verificatore non supervisionato regolarizzato da regole logiche.
- Tratta il verificatore come una variabile latente binaria.
- Tre vincoli logici: consistenza di negazione, consistenza intra-gruppo, consistenza inter-gruppo.
- Raggruppa i percorsi di ragionamento per risposta finale.
- Supera le baseline non supervisionate su 10 dataset.
- Raggiunge in media il 95% delle prestazioni di un verificatore supervisionato.
- Compatibile con qualsiasi LLM già disponibile.
- Codice sorgente su https://github.com/wangx
Entità
—