Geo-R1: Messa a Punto per Rinforzo Ragionamento-centrica per il Riferimento Geospaziale Few-Shot
Geo-R1 è un paradigma di messa a punto per rinforzo (RFT) incentrato sul ragionamento, volto a migliorare la comprensione few-shot di espressioni di riferimento geospaziale nel telerilevamento. Affronta le sfide incontrate dalla messa a punto supervisionata (SFT) su modelli linguistici multimodali di grandi dimensioni, in particolare in situazioni con dati scarsi. L'approccio richiede che il modello crei inizialmente catene di ragionamento chiare e interpretabili che scompongono le espressioni di riferimento, utilizzando successivamente queste motivazioni per identificare gli oggetti target. Questo metodo di dare priorità al ragionamento prima dell'azione migliora sia la generalizzazione che l'interpretabilità, anche con annotazioni minime. L'efficacia del modello è stata valutata utilizzando tre benchmark per il riferimento geospaziale few-shot.
Fatti principali
- Geo-R1 è un paradigma di messa a punto per rinforzo per il riferimento geospaziale few-shot.
- Affronta la scarsa generalizzazione di SFT in scenari con dati scarsi.
- Il modello genera catene di ragionamento prima di localizzare gli oggetti.
- Validato su tre benchmark di riferimento geospaziale few-shot.
- Pubblicato su arXiv con ID 2509.21976.
- Tipo di annuncio: replace-cross.
Entità
Istituzioni
- arXiv