APPSI-139: Nuovo Corpus per la Sintesi delle Politiche sulla Privacy
I ricercatori hanno presentato APPSI-139, una raccolta accuratamente assemblata di politiche sulla privacy in inglese, annotate da esperti per facilitarne la sintesi e l'interpretazione. Include 139 politiche sulla privacy, 15.692 testi paralleli riscritti e 36.351 etichette di annotazione suddivise in 11 categorie relative alle pratiche dei dati. Parallelamente, hanno lanciato anche TCSI-pp-V2, un framework ibrido volto a migliorare la sintesi e la comprensione di queste politiche. Questo sforzo colma la mancanza di un corpus parallelo inglese raffinato, che migliorerà la chiarezza legale e renderà più facile per gli utenti navigare in documenti complessi sulla privacy.
Fatti principali
- APPSI-139 è un corpus di politiche sulla privacy in inglese di alta qualità.
- È stato meticolosamente annotato da esperti del settore.
- Il corpus include 139 politiche sulla privacy in inglese.
- Contiene 15.692 corpora paralleli riscritti.
- Ha 36.351 etichette di annotazione a grana fine.
- Le etichette coprono 11 categorie di pratiche dei dati.
- TCSI-pp-V2 è un framework ibrido per sintesi e interpretazione.
- La ricerca mira a migliorare la chiarezza legale e la leggibilità delle politiche sulla privacy.
Entità
—