Il classificatore BERT identifica 55.000 lettere nei wenji Ming-Qing
Lepton, un classificatore BERT potenziato, determina se un titolo nei contenuti dei wenji in cinese classico si riferisce a una lettera personale o a una prefazione potenzialmente confondibile. È stato messo a punto utilizzando 5.438 titoli etichettati manualmente provenienti da 33 letterati del tardo Ming e del primo Qing. Disponibile su Hugging Face, Lepton è stato utilizzato dal China Biographical Database (CBDB) per individuare circa 55.000 lettere che vanno dalla metà Ming al primo Qing, contribuendo alla Ming Letter Platform.
Fatti principali
- Lepton è un classificatore BERT messo a punto per titoli di lettere personali nei wenji in cinese classico.
- Distingue le lettere personali da prefazioni facilmente confondibili, in particolare le prefazioni di addio.
- Messo a punto su bert-base-chinese con 5.438 titoli di wenji etichettati a mano.
- I titoli provengono da trentatré letterati del tardo Ming e del primo Qing.
- Modello distribuito su Hugging Face.
- Utilizzato presso il China Biographical Database (CBDB).
- Identificate circa cinquantacinquemila lettere nei wenji dalla metà Ming al primo Qing.
- Alimenta la Ming Letter Platform.
Entità
Istituzioni
- China Biographical Database (CBDB)
- Ming Letter Platform
- Hugging Face