Hermes: Intrecciare il Ragionamento Matematico Informale e Formale nei LLM
I ricercatori hanno presentato Hermes, il primo agente assistito da strumenti che integra perfettamente il ragionamento informale con dimostrazioni formalmente verificate all'interno di Lean. Mentre la matematica informale offre flessibilità ed efficienza per il ragionamento dei LLM, è spesso afflitta da incongruenze logiche e sottili errori difficili da individuare. D'altro canto, la dimostrazione formale dei teoremi fornisce un ragionamento rigoroso e verificabile, ma manca della libertà di esplorazione. Hermes concilia questi problemi effettuando controlli formali intermedi per prevenire derive nel ragionamento e utilizzando un modulo di memoria per mantenere la continuità della dimostrazione durante processi di ragionamento multi-step. Questo framework affronta una limitazione significativa degli attuali agenti matematici basati su LLM, che faticano a fondere efficacemente i vantaggi di entrambi gli approcci. L'annuncio è stato fatto su arXiv con l'identificatore 2511.18760.
Fatti principali
- Hermes è il primo agente assistito da strumenti che intreccia il ragionamento informale con dimostrazioni formalmente verificate in Lean.
- La matematica informale è flessibile ma soggetta a lacune logiche ed errori.
- La dimostrazione formale dei teoremi fornisce un ragionamento rigoroso e verificabile, ma manca di libertà esplorativa.
- Hermes esegue controlli formali intermedi per prevenire derive nel ragionamento.
- Hermes include un modulo di memoria per la continuità della dimostrazione attraverso catene di ragionamento multi-step.
- Il framework consente sia l'esplorazione che la verifica nel ragionamento matematico.
- Gli attuali agenti matematici basati su LLM mancano di un modo strutturato per combinare ragionamento informale e formale.
- Il lavoro è stato annunciato su arXiv con l'identificatore 2511.18760.
Entità
Istituzioni
- arXiv