Congetture Formali: Un Benchmark in Lean 4 per la Scoperta Matematica
Formal Conjectures è un benchmark in evoluzione composto da 2.615 enunciati di problemi matematici formalizzati in Lean 4, progettato per valutare sistemi di ragionamento automatico. Il dataset include 1.029 congetture di ricerca aperte per la scoperta di dimostrazioni a contaminazione zero e 836 problemi risolti per l'autoformalizzazione delle dimostrazioni. Proveniente da aree di ricerca matematica attiva, fornisce un'interfaccia strutturata che collega matematici, sistemi di IA e risolutori umani. Il benchmark ha già permesso nuove scoperte matematiche, incluse risoluzioni di congetture aperte. Il progetto enfatizza la correttezza attraverso una rigorosa formalizzazione.
Fatti principali
- Il benchmark contiene 2.615 enunciati di problemi formalizzati in Lean 4
- Include 1.029 congetture di ricerca aperte
- Include 836 problemi risolti per l'autoformalizzazione
- Proviene da aree di ricerca matematica attiva
- Fornisce un'interfaccia che collega matematici con IA e risolutori umani
- Già utilizzato per risolvere congetture di ricerca aperte
- Si concentra sulla contaminazione zero per la scoperta di dimostrazioni
- Garantisce la correttezza delle formalizzazioni
Entità
—