Sistema di Valutazione Basato su LLM per Studenti di Inglese Non Madrelingua K-12
Un nuovo framework adatta gli output dei modelli linguistici di grandi dimensioni (LLM) ai livelli di competenza degli studenti di inglese K-12 in contesti non madrelingua, utilizzando il curriculum nazionale cinese (CSE) come caso di studio. Il sistema controlla la complessità lessicale tramite un sistema di valutazione a quattro livelli, supportato da liste di vocabolario graduate e un corpus di dialoghi multi-turno. Il contributo tecnico principale è l'algoritmo DDPO (Diversity Driven Policy Optimization), un approccio basato su GRPO multi-turno che preserva la diversità del dialogo ottimizzando la qualità. DDPO raggiunge bassi tassi di vocaboli fuori dal vocabolario e alta diversità, migliorando la naturalezza conversazionale e l'efficacia pedagogica. La ricerca affronta la sfida diffusa della discrepanza di competenza negli LLM per l'istruzione.
Fatti principali
- Il framework adatta gli output degli LLM alle abilità degli studenti
- Utilizza il curriculum nazionale cinese (CSE) come caso rappresentativo
- Sistema di valutazione a quattro livelli per la complessità lessicale
- Nuove risorse: liste di vocabolario graduate e corpus di dialoghi multi-turno
- Contributo tecnico principale: algoritmo DDPO
- DDPO sta per Diversity Driven Policy Optimization
- DDPO è un approccio basato su GRPO multi-turno
- Raggiunge bassi tassi di vocaboli fuori dal vocabolario e alta diversità
Entità
—