TAVIS: Benchmark per la Visione Attiva nell'Apprendimento per Imitazione

ai-technology · 2026-05-11

Un nuovo benchmark chiamato TAVIS è stato lanciato da ricercatori per valutare la visione attiva nell'ambito dell'apprendimento per imitazione. La visione attiva consente a una policy di dirigere lo sguardo mentre esegue compiti, dimostrando vantaggi ma mancando di un quadro di valutazione unificato. TAVIS presenta due serie di compiti: TAVIS-Head, che include cinque compiti che utilizzano colli pan/tilt per la ricerca globale, e TAVIS-Hands, che comprende tre compiti che impiegano telecamere da polso per l'occlusione locale. Questi sono implementati su due modelli di torso umanoide, GR1T2 e Reachy2, sviluppati in IsaacLab. Inoltre, offre tre componenti di valutazione: un confronto tra telecamera sulla testa e telecamera fissa, la metrica GALT (Gaze-Action Lead Time) per lo sguardo predittivo e divisioni procedurali ID/OOD.

Fatti principali

TAVIS è un benchmark per l'apprendimento per imitazione con visione attiva.
Include TAVIS-Head (5 compiti) e TAVIS-Hands (3 compiti).
Embodimenti utilizzati: GR1T2 e Reachy2.
Costruito su IsaacLab.
La metrica GALT quantifica lo sguardo anticipatorio.
Incluso il protocollo di confronto tra telecamera sulla testa e telecamera fissa.
Fornite divisioni procedurali ID/OOD.
La visione attiva è emersa come capacità chiave nell'apprendimento per imitazione.

Entità

—

Fonti

arXiv cs.AI — 2026-05-11