DivSkill-SQL: Ottimizzazione delle Competenze Residuali per Ensemble Text-to-SQL
DivSkill-SQL è un framework innovativo volto a migliorare le prestazioni Text-to-SQL sfruttando competenze residuali che gli ensemble esistenti potrebbero non possedere. Ottiene notevoli miglioramenti nelle metriche Pass@K senza la necessità di fine-tuning, registrando incrementi di 11,1 punti su Snowflake e 8,3 punti su BigQuery utilizzando il dataset Spider2-Lite, superando i risultati di base migliori. Inoltre, DivSkill-SQL dimostra progressi costanti sia con i modelli Opus-4.6 che GPT-5.4. Un vantaggio significativo di questo framework è la sua capacità di trasferire competenze tra diversi dialetti SQL senza sforzo, eliminando la necessità di ulteriore riaddestramento.
Fatti principali
- DivSkill-SQL è un framework di ottimizzazione delle competenze residuali.
- Costruisce ensemble Text-to-SQL agentici complementari senza fine-tuning del modello.
- Ogni nuova competenza è ottimizzata su esempi in cui l'ensemble corrente fallisce.
- Mira al contributo marginale su Pass@K.
- Su Spider2-Lite, migliora l'accuratezza selezionata fino a +11,1 punti su Snowflake.
- Su Spider2-Lite, migliora l'accuratezza selezionata fino a +8,3 punti su BigQuery.
- Guadagni costanti sui modelli base Opus-4.6 e GPT-5.4.
- Le competenze ottimizzate su un singolo dialetto si trasferiscono senza riaddestramento.
Entità
—