Il Contesto Semantico Migliora l'Accuratezza degli LLM nelle Query su Database del 17-23%

ai-technology · 2026-04-30

Uno studio recente pubblicato su arXiv (2604.25149) rivela che fornire agli LLM un documento di contesto semantico migliora notevolmente le loro prestazioni nelle query in linguaggio naturale su database analitici. I ricercatori hanno valutato tre modelli leader—Claude Opus 4.7, Claude Sonnet 4.6 e GPT-5.4—utilizzando 100 domande basate sul Cleaned Contoso Retail Dataset in ClickHouse. Ogni modello è stato sottoposto a due test: uno con il solo schema del warehouse e un altro con lo schema più un documento markdown da 4 KB che dettaglia misure, convenzioni e regole di disambiguazione. L'inclusione del documento ha portato a un aumento dell'accuratezza compreso tra +17 e +23 punti percentuali per tutti i modelli. Con il documento, le loro prestazioni variavano dal 67,7% al 68,7%, mentre senza di esso le prestazioni erano statisticamente simili. Lo studio osserva che risposte inaccurate e allucinazioni sicure si verificano quando i modelli tentano di dedurre la semantica aziendale assente dallo schema.

Fatti principali

Studio pubblicato su arXiv con ID 2604.25149
Confrontati Claude Opus 4.7, Claude Sonnet 4.6 e GPT-5.4
Utilizzato il Cleaned Contoso Retail Dataset in ClickHouse
Testate 100 domande in linguaggio naturale
Applicato protocollo single-shot accoppiato
Accuratezza migliorata di +17 a +23 punti percentuali con contesto semantico
Con contesto, i modelli hanno ottenuto 67,7-68,7%
Senza contesto, i modelli erano statisticamente indistinguibili

Il Contesto Semantico Migliora l'Accuratezza degli LLM nelle Query su Database del 17-23%

Fatti principali

Entità

Istituzioni

Fonti