ARTFEED — Contemporary Art Intelligence

Ax-Prover: Sistema Multi-Agente per la Dimostrazione Automatica di Teoremi in Matematica e Fisica

ai-technology · 2026-05-25

Ax-Prover è un sistema multi-agente per la dimostrazione automatica di teoremi in Lean, in grado di risolvere problemi in ambiti scientifici in modo autonomo o in collaborazione con esperti umani. Integra modelli linguistici di grandi dimensioni (LLM) per il ragionamento con strumenti Lean tramite il Model Context Protocol (MCP) per garantire la correttezza formale. Testato su LLM all'avanguardia e dimostratori specializzati su dataset matematici pubblici e nuovi benchmark Lean in algebra astratta e teoria quantistica, Ax-Prover raggiunge prestazioni competitive e supera i sistemi esistenti.

Fatti principali

  • Ax-Prover è un sistema multi-agente per la dimostrazione automatica di teoremi in Lean.
  • Opera in modo autonomo o in collaborazione con esperti umani.
  • Utilizza LLM per il ragionamento e strumenti Lean tramite MCP per la correttezza formale.
  • Testato su benchmark matematici pubblici e nuovi benchmark Lean in algebra astratta e teoria quantistica.
  • Competitivo con i dimostratori all'avanguardia su dataset pubblici.
  • Supera ampiamente i sistemi esistenti sui benchmark introdotti.
  • Pubblicato su arXiv con ID 2510.12787.
  • Copre i domini della matematica e della fisica quantistica.

Entità

Istituzioni

  • arXiv
  • Lean

Fonti