I LLM apprendono la semantica costruzionale per rare frasi inglesi a fuoco accoppiato
Un nuovo studio da arXiv (2605.31586) indaga se i grandi modelli linguistici comprendono la semantica di rare costruzioni inglesi come "let alone" e "much less". I ricercatori hanno creato un dataset innovativo che testa le costruzioni a fuoco accoppiato utilizzando la semantica aggettivale scalare e la conoscenza del mondo. Hanno scoperto che diversi modelli di dimensioni modeste sono sensibili sia alla forma che al significato, mentre i modelli addestrati su dati su scala umana falliscono tutte le valutazioni di significato. Lo studio esamina anche le dinamiche di addestramento per modelli a checkpoint aperto.
Fatti principali
- Lo studio si concentra su rare costruzioni a fuoco accoppiato in inglese
- Gli esempi includono 'let alone' e 'much less'
- Il nuovo dataset testa i significati usando la semantica aggettivale scalare e la conoscenza del mondo
- Diversi modelli di dimensioni modeste mostrano sensibilità a forma e significato
- I modelli addestrati su dati su scala umana falliscono tutte le valutazioni di significato
- Lo studio esamina le dinamiche di addestramento per modelli a checkpoint aperto
- Numero del paper arXiv: 2605.31586
- La ricerca affronta una questione aperta sulla comprensione costruzionale dei modelli open-source
Entità
Istituzioni
- arXiv