ARTFEED — Contemporary Art Intelligence

PExA: Agente di Esplorazione Parallela Raggiunge il 70.2% su Spider 2.0

ai-technology · 2026-04-29

I ricercatori hanno introdotto PExA (Agente di Esplorazione Parallela), un nuovo framework basato su LLM per la generazione text-to-SQL che riformula il compito attraverso la copertura dei test software. Invece di un processo sequenziale, PExA prepara la query originale con una serie di casi di test utilizzando SQL atomici più semplici eseguiti in parallelo per garantire la copertura semantica. La query finale viene generata solo dopo aver raccolto informazioni sufficienti dai casi di test SQL esplorati. Validato sul benchmark Spider 2.0, PExA raggiunge una nuova accuratezza di esecuzione allo stato dell'arte del 70.2%.

Fatti principali

  • PExA sta per Agente di Esplorazione Parallela.
  • È progettato per compiti text-to-SQL complessi.
  • Il framework utilizza l'esecuzione parallela di SQL atomici come casi di test.
  • Affronta il compromesso tra latenza e prestazioni negli agenti basati su LLM.
  • La query finale viene generata dopo la copertura iterativa dei casi di test.
  • PExA ha raggiunto un'accuratezza di esecuzione del 70.2% su Spider 2.0.
  • Spider 2.0 è un benchmark all'avanguardia per text-to-SQL.
  • La ricerca è pubblicata su arXiv sotto Computer Science > Intelligenza Artificiale.

Entità

Istituzioni

  • arXiv

Fonti