CA-SQL: Text-to-SQL con Consapevolezza della Complessità e Budget di Calcolo Dinamico
Un nuovo pipeline Text-to-SQL chiamato CA-SQL è stato sviluppato da ricercatori, che adatta la sua ampiezza di esplorazione in base alla complessità del compito. Questo sistema stima la difficoltà per determinare i budget di calcolo, impiega un seeding personalizzato dei prompt influenzato dalla ricerca evolutiva e utilizza una tecnica di voto innovativa per identificare la query candidata ottimale. Sul benchmark Bird-Bench (BIRD), CA-SQL ha raggiunto un punteggio leader del 51,72% sul suo sottoinsieme più difficile, affrontando efficacemente i limiti dell'esplorazione dello spazio delle soluzioni osservati negli approcci di apprendimento al momento dell'inferenza esistenti.
Fatti principali
- CA-SQL è un pipeline Text-to-SQL.
- Utilizza la difficoltà stimata del compito per scalare l'ampiezza di esplorazione.
- Il seeding personalizzato dei prompt si basa su principi di ricerca evolutiva.
- Un metodo di voto innovativo seleziona la migliore soluzione candidata.
- Raggiunge il 51,72% sul sottoinsieme impegnativo di Bird-Bench.
- Affronta l'inadeguata esplorazione dello spazio delle soluzioni.
- Pubblicato su arXiv come 2605.08057.
- Tipo di annuncio: cross.
Entità
Istituzioni
- arXiv