RSRCC: Un Benchmark per il Question-Answering sui Cambiamenti nel Telerilevamento tramite Ranking Retrieval-Augmented
I ricercatori hanno introdotto RSRCC, un nuovo benchmark per il question-answering sui cambiamenti nel telerilevamento. Contiene 126.000 domande, suddivise in 87.000 per training, 17.100 per validazione e 22.000 per test. A differenza dei dataset precedenti che descrivono differenze a livello di immagine complessiva, RSRCC si concentra su domande localizzate e specifiche per i cambiamenti, richiedendo un ragionamento semantico fine. Questo è il primo benchmark per il QA sui cambiamenti nel telerilevamento progettato per una supervisione basata sul ragionamento. Il dataset è stato costruito utilizzando una pipeline di curation semi-supervisionata gerarchica che impiega il ranking Best-of-N come fase finale di risoluzione dell'ambiguità. Il lavoro è pubblicato su arXiv con ID 2604.20623.
Fatti principali
- RSRCC è un benchmark per il question-answering sui cambiamenti nel telerilevamento.
- Contiene 126.000 domande in totale.
- Set di training: 87.000 domande.
- Set di validazione: 17.100 domande.
- Set di test: 22.000 domande.
- Le domande sono localizzate e specifiche per i cambiamenti.
- Primo benchmark per il ragionamento fine nel QA sui cambiamenti nel telerilevamento.
- Costruito tramite curation semi-supervisionata gerarchica con ranking Best-of-N.
Entità
Istituzioni
- arXiv