Rule-VLN: Nuovo Benchmark di Intelligenza Artificiale per la Navigazione Socialmente Conforme negli Ambienti Urbani
È stato lanciato un nuovo insieme di linee guida chiamato Rule-VLN per migliorare le carenze riscontrate negli attuali sistemi di Navigazione Visione-e-Linguaggio. Questi sistemi spesso si concentrano troppo sul layout fisico trascurando aspetti normativi cruciali. Il nuovo benchmark urbano comprende 29.000 nodi e include 177 categorie normative uniche distribuite su 8.000 nodi con restrizioni. Sfida gli agenti con vincoli visivi e comportamentali specifici attraverso quattro livelli di difficoltà. Per aumentare la consapevolezza della sicurezza negli agenti pre-addestrati, è stato sviluppato uno strumento chiamato Modulo di Rettifica della Navigazione Semantica (SNRM). Questa soluzione universale unisce un framework di percezione visiva con una mappa mentale epistemica. Questo studio, che esplora l'evoluzione dell'IA dal completamento di compiti di base all'adesione a norme sociali, è stato condiviso su arXiv con l'ID 2604.16993v1.
Fatti principali
- Rule-VLN è il primo benchmark urbano su larga scala per la navigazione conforme alle regole
- L'ambiente si estende su 29.000 nodi con 8.000 nodi vincolati
- 177 categorie normative diverse sono incorporate nel benchmark
- Quattro livelli curriculari sfidano gli agenti con vincoli granulari
- Il Modulo di Rettifica della Navigazione Semantica (SNRM) è un modulo universale zero-shot
- SNRM integra il framework VLM di percezione visiva con una mappa mentale epistemica
- Gli attuali agenti VLN soffrono di una "trappola guidata dall'obiettivo" che privilegia le regole fisiche rispetto a quelle semantiche
- La ricerca è stata annunciata su arXiv con l'identificatore 2604.16993v1
Entità
Istituzioni
- arXiv