Il Dataset RoMathExam Racchiude 130 Anni di Esami di Matematica Rumeni per la Ricerca sull'IA
Il dataset RoMathExam offre un archivio completo degli esami di matematica delle scuole superiori rumene dal 1895 al 2025. Comprende oltre 10.592 problemi matematici, organizzati in più di 600 set completi di esami attraverso i percorsi M1-M4. Questa risorsa presenta un nucleo standardizzato che copre sette decenni, dal 1957 al 2025, includendo sia gli esami nazionali ufficiali che le varianti di allenamento pubblicate dal ministero. Ogni problema è digitalizzato con precisione e segue uno schema JSON unificato per una provenienza tracciabile. Inoltre, il dataset include tag tematici allineati al curriculum e incorporazioni testuali dense per il rilevamento delle varianti, la deduplicazione e il recupero per similarità. Per colmare la lacuna nei dati psicometrici storici, i ricercatori hanno introdotto una metrica di complessità validata come proxy intrinseco scalabile, supportando la ricerca sull'IA nell'Educazione con dati di valutazione autentici.
Fatti principali
- Il dataset copre il periodo 1895-2025 con nucleo dal 1957-2025
- Contiene 10.592 problemi di matematica
- Organizzato in oltre 600 set completi di esami
- Copre percorsi multipli (M1-M4)
- Include esami ufficiali e varianti di allenamento
- Presenta schema JSON unificato con provenienza
- Arricchito con tag tematici e incorporazioni testuali
- Propone una metrica di complessità delle soluzioni
Entità
—