ARTFEED — Contemporary Art Intelligence

MCF-Proto: Quadri d'azione incentrati sul movimento per modelli VLA

other · 2026-05-13

MCF-Proto, un nuovo head d'azione leggero, migliora i modelli Vision-Language-Action (VLA) introducendo un Motion-Centric Action Frame (MCF) insieme alla parametrizzazione delle azioni basata su prototipi. Invece di prevedere azioni in un sistema di coordinate mondiali statiche, la politica determina una rotazione R_t in SO(3), costruisce azioni nel sistema di riferimento locale regolato utilizzando prototipi, e successivamente le ritraduce nel sistema mondiale per un addestramento completo basato esclusivamente su dimostrazioni standard. Questo design innovativo favorisce una struttura emergente stabile: i sistemi di riferimento locali appresi creano assi che si allineano strettamente con il movimento dell'end-effector, anche in assenza di etichette direzionali esplicite. Questo metodo affronta efficacemente l'uniformità presente negli head d'azione VLA esistenti.

Fatti principali

  • 1. MCF-Proto è un head d'azione leggero per modelli VLA.
  • 2. Utilizza un Motion-Centric Action Frame (MCF) e la parametrizzazione delle azioni basata su prototipi.
  • 3. La politica prevede una rotazione R_t in SO(3) ad ogni passo.
  • 4. Le azioni sono composte nel sistema di riferimento locale trasformato a partire dai prototipi.
  • 5. L'addestramento è end-to-end utilizzando solo dimostrazioni standard senza supervisione ausiliaria.
  • 6. I sistemi di riferimento locali appresi sviluppano una struttura geometrica stabile compatibile con il movimento dell'end-effector.
  • 7. Non sono necessarie etichette direzionali esplicite per questa struttura emergente.
  • 8. L'approccio affronta l'omogeneità negli attuali head d'azione VLA.

Entità

Fonti