UrbanDataMiner Portal Lanciato con 60.000 Dataset Estratti da Pubblicazioni Affiliate a Nature
Un nuovo portale aperto chiamato UrbanDataMiner offre ora ricerca e filtraggio a livello di dataset per oltre 60.000 dataset urbani, affrontando la mancanza di una piattaforma globale unificata per la scoperta di dati urbani. Questo strumento è alimentato da Paper2Data, una pipeline su larga scala guidata da LLM che estrae e struttura automaticamente le menzioni di dataset dalla letteratura scientifica. Paper2Data elabora più di 15.000 pubblicazioni affiliate a Nature, identificando dataset con un alto richiamo di circa il 90% e una precisione a livello di campo superiore all'80%, come convalidato da valutazioni annotate manualmente. La pipeline impiega uno schema di metadati unificato per i dati urbani per organizzare le informazioni estratte, consentendo ai ricercatori di individuare efficientemente dataset rilevanti senza ricerche manuali. I dati urbani supportano applicazioni diversificate in molteplici discipline, ma in precedenza i ricercatori dovevano setacciare siti web o articoli individualmente. Il preprint arXiv 2604.16317v1 dettaglia questa iniziativa interdisciplinare, che migliora l'accessibilità ai dati urbani globali per uso accademico e pratico.
Fatti principali
- UrbanDataMiner è un portale aperto per la scoperta di dati urbani
- Fornisce accesso a oltre 60.000 dataset urbani
- I dataset sono estratti da più di 15.000 pubblicazioni affiliate a Nature
- Paper2Data è una pipeline guidata da LLM per l'identificazione e la strutturazione dei dataset
- Paper2Data raggiunge circa il 90% di richiamo nell'identificazione dei dataset
- La precisione a livello di campo di Paper2Data è superiore all'80%
- Viene utilizzato uno schema di metadati unificato per i dati urbani per la strutturazione
- L'iniziativa affronta la mancanza di una piattaforma globale unificata per la scoperta di dati urbani
Entità
Istituzioni
- Nature