I modelli linguistici mostrano giudizi di plausibilità simili a quelli umani
Un nuovo studio da arXiv (2507.12553) rivela che i modelli linguistici (LM) possono classificare in modo affidabile le frasi per categoria modale—se un evento è possibile, impossibile o senza senso—contrariamente a risultati precedenti. I ricercatori hanno identificato rappresentazioni lineari chiamate vettori di differenza modale all'interno dei LM che discriminano tra queste categorie. L'analisi mostra che questi vettori emergono in un ordine coerente man mano che i modelli migliorano attraverso passi di addestramento, strati e numero di parametri. Il lavoro mette in dubbio precedenti dubbi sulle capacità di ragionamento modale dei LM (Michaelov et al., 2025; Kauf et al., 2023).
Fatti principali
- Lo studio identifica vettori di differenza modale nei LM
- I LM possono classificare le frasi per modalità in modo affidabile
- I vettori di differenza modale emergono coerentemente con la competenza del modello
- Contraddice studi precedenti di Michaelov et al. e Kauf et al.
- Pubblicato su arXiv con ID 2507.12553
- La ricerca si concentra sui giudizi di plausibilità degli eventi
- I vettori appaiono attraverso passi di addestramento, strati e numero di parametri
- Le rappresentazioni lineari discriminano tra categorie modali
Entità
Istituzioni
- arXiv