Lingue a Basse Risorse nel Web Semantico Definite
Una nuova metodologia categorizza le lingue nei Knowledge Graph dei Linked Open Data come a basse, medie o alte risorse, con l'obiettivo di affrontare il divario digitale. Lo studio utilizza DBpedia, BabelNet e Wikidata per proporre una definizione formale per le lingue a basse risorse, consentendo un migliore trasferimento cross-linguistico nell'IA. Questo lavoro evidenzia come le tecnologie emergenti aggravino la disuguaglianza nell'Accesso Aperto ai Dati, escludendo molte comunità dalla trasformazione digitale.
Fatti principali
- 1. Le tecnologie digitali emergenti aggravano il divario nell'Accesso Aperto ai Dati tra lingue ad alte e basse risorse.
- 2. I Knowledge Graph multilingue dei Linked Open Data potrebbero mitigare il divario attraverso il trasferimento cross-linguistico.
- 3. Prima di questo studio non esisteva una chiara definizione quantitativa di lingue a basse risorse per i LOD KG.
- 4. La metodologia analizza la distribuzione linguistica nei LOD KG.
- 5. Una categorizzazione preliminare a più livelli si basa su DBpedia, BabelNet e Wikidata.
- 6. La categorizzazione fornisce definizioni formali per lingue a basse, alte e medie risorse.
- 7. Le definizioni possono essere utilizzate per selezionare candidati per il trasferimento cross-linguistico.
- 8. Il lavoro è presentato come poster nel campo dell'Informatica > Intelligenza Artificiale.
Entità
Istituzioni
- DBpedia
- BabelNet
- Wikidata
- Semantic Scholar
- arXiv