ARTFEED — Contemporary Art Intelligence

Phone2Act: Teleoperazione basata su smartphone per la raccolta di dati robotici

ai-technology · 2026-05-06

Un team di ricercatori ha creato Phone2Act, un sistema di teleoperazione economico che trasforma uno smartphone standard in un controller robotico a 6 gradi di libertà (6-DoF) utilizzando Google ARCore. Questa soluzione hardware-agnostica è costruita su un framework modulare ROS 2 con nodi bridge intercambiabili, supportando varie piattaforme, dai cobot industriali a bracci bimanuali a basso costo, senza richiedere modifiche al codice. Un Universal Recorder allinea i flussi RGB multi-camera con il feedback dello stato del robot e facilita l'esportazione di dimostrazioni nel formato dataset LeRobot, consentendo un rapido fine-tuning di VLA. L'efficacia di questo framework è stata confermata tramite il fine-tuning di GR00T-N1.5 utilizzando 130 dimostrazioni, con l'obiettivo di semplificare e ridurre i costi associati alla raccolta di dati di manipolazione diversificati per l'addestramento di modelli Vision-Language-Action, migliorando così l'accessibilità per i team di ricerca.

Fatti principali

  • Phone2Act trasforma uno smartphone commerciale in un controller robotico 6-DoF tramite Google ARCore.
  • Il framework è hardware-agnostico e costruito su un'architettura modulare ROS 2.
  • Supporta piattaforme dai cobot industriali a bracci bimanuali a basso costo senza modifiche al codice.
  • Un Universal Recorder sincronizza i flussi RGB multi-camera con il feedback dello stato del robot.
  • Esporta le dimostrazioni nativamente nel formato dataset LeRobot.
  • Validato tramite fine-tuning di GR00T-N1.5 su 130 dimostrazioni.
  • Obiettivo: ridurre costo e complessità della raccolta di dati di manipolazione per l'addestramento di modelli VLA.
  • Pubblicato su arXiv con ID 2605.01948.

Entità

Istituzioni

  • Google ARCore
  • LeRobot
  • GR00T-N1.5

Fonti