Sistema di Valutazione Basato su LLM per Studenti di Inglese Non Madrelingua K-12

other · 2026-04-27

Un nuovo framework adatta gli output dei modelli linguistici di grandi dimensioni (LLM) ai livelli di competenza degli studenti di inglese K-12 in contesti non madrelingua, utilizzando il curriculum nazionale cinese (CSE) come caso di studio. Il sistema controlla la complessità lessicale tramite un sistema di valutazione a quattro livelli, supportato da liste di vocabolario graduate e un corpus di dialoghi multi-turno. Il contributo tecnico principale è l'algoritmo DDPO (Diversity Driven Policy Optimization), un approccio basato su GRPO multi-turno che preserva la diversità del dialogo ottimizzando la qualità. DDPO raggiunge bassi tassi di vocaboli fuori dal vocabolario e alta diversità, migliorando la naturalezza conversazionale e l'efficacia pedagogica. La ricerca affronta la sfida diffusa della discrepanza di competenza negli LLM per l'istruzione.

Fatti principali

Il framework adatta gli output degli LLM alle abilità degli studenti
Utilizza il curriculum nazionale cinese (CSE) come caso rappresentativo
Sistema di valutazione a quattro livelli per la complessità lessicale
Nuove risorse: liste di vocabolario graduate e corpus di dialoghi multi-turno
Contributo tecnico principale: algoritmo DDPO
DDPO sta per Diversity Driven Policy Optimization
DDPO è un approccio basato su GRPO multi-turno
Raggiunge bassi tassi di vocaboli fuori dal vocabolario e alta diversità

Entità

—

Fonti

arXiv cs.AI — 2026-04-27