ARTFEED — Contemporary Art Intelligence

LeanSearch v2: Recupero Globale delle Premesse per la Dimostrazione di Teoremi in Lean 4

other · 2026-05-14

LeanSearch v2 è un framework di recupero a due modalità progettato per il recupero globale delle premesse nella dimostrazione di teoremi in Lean 4. La sua modalità standard sfrutta un corpus Mathlib informalizzato gerarchicamente insieme a una pipeline di embedding e riordinamento, raggiungendo prestazioni leader nel recupero a singola query (nDCG@10 di 0,62, superando il sistema successivo con 0,53) senza richiedere messa a punto specifica del dominio. Nel frattempo, la modalità di ragionamento si concentra sul recupero globale delle premesse attraverso cicli iterativi di abbozzo-recupero-riflessione. Questo sistema identifica efficacemente una raccolta dispersa di lemmi di libreria per dimostrazioni succinte, un'area non adeguatamente affrontata dagli strumenti esistenti come i motori di ricerca semantica e i sistemi di selezione delle premesse. Per la valutazione, è stato utilizzato un benchmark composto da 69 query relative a teoremi Mathlib a livello di ricerca.

Fatti principali

  • LeanSearch v2 è un sistema di recupero a due modalità per la dimostrazione di teoremi in Lean 4.
  • La modalità standard utilizza un corpus Mathlib informalizzato gerarchicamente con una pipeline di embedding e riordinamento.
  • Raggiunge un nDCG@10 di 0,62 contro 0,53 del sistema successivo.
  • Non richiede messa a punto specifica del dominio.
  • La modalità di ragionamento utilizza cicli iterativi di abbozzo-recupero-riflessione.
  • Affronta il recupero globale delle premesse per interi teoremi.
  • Gli strumenti esistenti trovano solo dichiarazioni individuali o prevedono lemmi passo dopo passo.
  • Valutato su un benchmark di 69 query di teoremi Mathlib a livello di ricerca.

Entità

Istituzioni

  • arXiv
  • Mathlib

Fonti