Nuovo strumento computazionale classifica su larga scala verbi di modo e risultato
Un nuovo approccio computazionale scalabile è stato creato da ricercatori per individuare verbi di modo e risultato all'interno di contesti frasali, colmando una lacuna negli studi sullo sviluppo linguistico. Utilizzando prompt linguisticamente informati, hanno prodotto annotazioni a livello di frase usando modelli linguistici di grandi dimensioni su dati provenienti da MASC e InterCorp, ampliando la copertura da precedenti segmenti annotati di VerbNet a 436 classi. Un classificatore basato su RoBERTa è stato addestrato con queste annotazioni e testato su tre dataset gold standard, che includevano elementi precedentemente annotati e un nuovo set annotato da esperti. Il modello ha mostrato prestazioni incoraggianti con una precisione media. Questo strumento innovativo facilita la misurazione su larga scala di una distinzione che è stata difficile da esaminare a causa della scarsità di risorse annotate.
Fatti principali
- Lo strumento identifica verbi di modo e risultato nel contesto frasale
- Utilizza prompt linguisticamente informati con modelli linguistici di grandi dimensioni
- Dati tratti dai corpora MASC e InterCorp
- Copertura estesa da VerbNet a 436 classi
- Classificatore basato su RoBERTa addestrato su annotazioni generate
- Valutato su tre dataset gold standard tenuti da parte
- Include un nuovo dataset annotato da esperti
- Il modello mostra una precisione media promettente
Entità
Istituzioni
- VerbNet
- MASC
- InterCorp