Preemptione Statistica nei LLM: Evidenze Causali da Abbinamenti Verbo-Costruzione

ai-technology · 2026-05-25

Una recente indagine computazionale pubblicata su arXiv (2605.23039) offre intuizioni causali che indicano come i grandi modelli linguistici (LLM) apprendano strutture linguistiche non consentite tramite preemptione statistica, un concetto della Grammatica delle Costruzioni. Questo studio distingue efficacemente la preemptione statistica dall'ipotesi alternativa di radicamento utilizzando un disegno unificato su quattro esperimenti che coinvolgono 120 combinazioni verbo-costruzione in inglese (dativo, causativo, locativo). I risultati rivelano una forte correlazione (r = 0,79) tra i pattern di sorpresa dei LLM e i giudizi di accettabilità umani, corroborata da tre dataset comportamentali separati. I risultati sottolineano che la frequenza delle forme concorrenti, piuttosto che la frequenza generale dei verbi, guida questi pattern. Questa ricerca segna la prima evidenza computazionale di preemptione statistica nei LLM, gettando luce su come sia i modelli che probabilmente gli esseri umani comprendano i vincoli linguistici senza evidenza negativa.

Fatti principali

Studio pubblicato su arXiv con ID 2605.23039
Indaga la preemptione statistica nei grandi modelli linguistici
Quattro esperimenti con 120 abbinamenti verbo-costruzione in inglese
La sorpresa dei LLM correla con i giudizi umani a r = 0,79
Validato contro tre dataset comportamentali indipendenti
La frequenza delle forme concorrenti guida i pattern, non la frequenza complessiva del verbo
Correlazioni parziali non circolari confermano la sensibilità alla preemptione
Prima dissociazione computazionale diretta tra preemptione e radicamento

Preemptione Statistica nei LLM: Evidenze Causali da Abbinamenti Verbo-Costruzione

Fatti principali

Entità

Istituzioni

Fonti