ARTFEED — Contemporary Art Intelligence

Preemptione Statistica nei LLM: Evidenze Causali da Abbinamenti Verbo-Costruzione

ai-technology · 2026-05-25

Una recente indagine computazionale pubblicata su arXiv (2605.23039) offre intuizioni causali che indicano come i grandi modelli linguistici (LLM) apprendano strutture linguistiche non consentite tramite preemptione statistica, un concetto della Grammatica delle Costruzioni. Questo studio distingue efficacemente la preemptione statistica dall'ipotesi alternativa di radicamento utilizzando un disegno unificato su quattro esperimenti che coinvolgono 120 combinazioni verbo-costruzione in inglese (dativo, causativo, locativo). I risultati rivelano una forte correlazione (r = 0,79) tra i pattern di sorpresa dei LLM e i giudizi di accettabilità umani, corroborata da tre dataset comportamentali separati. I risultati sottolineano che la frequenza delle forme concorrenti, piuttosto che la frequenza generale dei verbi, guida questi pattern. Questa ricerca segna la prima evidenza computazionale di preemptione statistica nei LLM, gettando luce su come sia i modelli che probabilmente gli esseri umani comprendano i vincoli linguistici senza evidenza negativa.

Fatti principali

  • Studio pubblicato su arXiv con ID 2605.23039
  • Indaga la preemptione statistica nei grandi modelli linguistici
  • Quattro esperimenti con 120 abbinamenti verbo-costruzione in inglese
  • La sorpresa dei LLM correla con i giudizi umani a r = 0,79
  • Validato contro tre dataset comportamentali indipendenti
  • La frequenza delle forme concorrenti guida i pattern, non la frequenza complessiva del verbo
  • Correlazioni parziali non circolari confermano la sensibilità alla preemptione
  • Prima dissociazione computazionale diretta tra preemptione e radicamento

Entità

Istituzioni

  • arXiv

Fonti