DivSkill-SQL: Ottimizzazione delle Competenze Residuali per Ensemble Text-to-SQL

ai-technology · 2026-05-23

DivSkill-SQL è un framework innovativo volto a migliorare le prestazioni Text-to-SQL sfruttando competenze residuali che gli ensemble esistenti potrebbero non possedere. Ottiene notevoli miglioramenti nelle metriche Pass@K senza la necessità di fine-tuning, registrando incrementi di 11,1 punti su Snowflake e 8,3 punti su BigQuery utilizzando il dataset Spider2-Lite, superando i risultati di base migliori. Inoltre, DivSkill-SQL dimostra progressi costanti sia con i modelli Opus-4.6 che GPT-5.4. Un vantaggio significativo di questo framework è la sua capacità di trasferire competenze tra diversi dialetti SQL senza sforzo, eliminando la necessità di ulteriore riaddestramento.

Fatti principali

DivSkill-SQL è un framework di ottimizzazione delle competenze residuali.
Costruisce ensemble Text-to-SQL agentici complementari senza fine-tuning del modello.
Ogni nuova competenza è ottimizzata su esempi in cui l'ensemble corrente fallisce.
Mira al contributo marginale su Pass@K.
Su Spider2-Lite, migliora l'accuratezza selezionata fino a +11,1 punti su Snowflake.
Su Spider2-Lite, migliora l'accuratezza selezionata fino a +8,3 punti su BigQuery.
Guadagni costanti sui modelli base Opus-4.6 e GPT-5.4.
Le competenze ottimizzate su un singolo dialetto si trasferiscono senza riaddestramento.

Entità

—

Fonti

arXiv cs.AI — 2026-05-23