TAVIS: Benchmark per la Visione Attiva nell'Apprendimento per Imitazione
Un nuovo benchmark chiamato TAVIS è stato lanciato da ricercatori per valutare la visione attiva nell'ambito dell'apprendimento per imitazione. La visione attiva consente a una policy di dirigere lo sguardo mentre esegue compiti, dimostrando vantaggi ma mancando di un quadro di valutazione unificato. TAVIS presenta due serie di compiti: TAVIS-Head, che include cinque compiti che utilizzano colli pan/tilt per la ricerca globale, e TAVIS-Hands, che comprende tre compiti che impiegano telecamere da polso per l'occlusione locale. Questi sono implementati su due modelli di torso umanoide, GR1T2 e Reachy2, sviluppati in IsaacLab. Inoltre, offre tre componenti di valutazione: un confronto tra telecamera sulla testa e telecamera fissa, la metrica GALT (Gaze-Action Lead Time) per lo sguardo predittivo e divisioni procedurali ID/OOD.
Fatti principali
- TAVIS è un benchmark per l'apprendimento per imitazione con visione attiva.
- Include TAVIS-Head (5 compiti) e TAVIS-Hands (3 compiti).
- Embodimenti utilizzati: GR1T2 e Reachy2.
- Costruito su IsaacLab.
- La metrica GALT quantifica lo sguardo anticipatorio.
- Incluso il protocollo di confronto tra telecamera sulla testa e telecamera fissa.
- Fornite divisioni procedurali ID/OOD.
- La visione attiva è emersa come capacità chiave nell'apprendimento per imitazione.
Entità
—