La ricerca geospaziale sul web supera di gran lunga le etichette GIS tradizionali
Una recente analisi di 1,01 milioni di ricerche Bing dal dataset MS MARCO ha rivelato che il 18,0% (181.827 query) sono geospaziali, quasi tre volte superiori al 6,17% precedentemente classificato come Località. I ricercatori hanno utilizzato embedding densi di frasi, un classificatore SetFit e clustering basato sulla densità per categorizzare le query in 88 gruppi distinti. La maggior parte di queste query sono di natura transazionale e pratica, con costi e prezzi che rappresentano il 15,3% delle richieste geospaziali—quasi il doppio dell'intera categoria di geografia fisica. Una parte significativa di questi dati, inclusi costi, orari di apertura, informazioni di contatto, meteo e suggerimenti di viaggio, va oltre il quadro GIS convenzionale.
Fatti principali
- 181.827 delle 1,01 milioni di query Bing sono geospaziali (18,0%)
- Le annotazioni originali etichettavano solo il 6,17% come Località
- 88 categorie di query identificate tramite clustering
- Costi e prezzi costituiscono il 15,3% delle query geospaziali
- Il tema della geografia fisica è la metà delle query sui costi
- Utilizzati embedding densi di frasi e classificatore SetFit
- Analizzato il corpus MS MARCO senza filtraggio preliminare
- Lo studio evidenzia il divario tra ricerca geospaziale sul web e GIS tradizionale
Entità
Istituzioni
- Microsoft Bing
- MS MARCO