D-VLA: Framework di RL Distribuito per Modelli di IA Embodied
I ricercatori propongono D-VLA, un framework di reinforcement learning distribuito ad alta concorrenza per modelli Vision-Language-Action (VLA) nell'IA Embodied. Il framework affronta i colli di bottiglia sistemici derivanti dai conflitti di risorse tra la simulazione fisica ad alta fedeltà e le richieste di VRAM/banda del deep learning. D-VLA introduce il 'Plane Decoupling' per isolare fisicamente i dati di training ad alta frequenza dal controllo dei pesi a bassa frequenza, eliminando le interferenze tra simulazione e ottimizzazione. Una pipeline asincrona 'Swimlane' a quattro thread consente una sovrapposizione completa parallela di campionamento e training. Il lavoro è dettagliato nel preprint arXiv 2605.13276.
Fatti principali
- D-VLA è un framework RL distribuito per modelli VLA
- Affronta i colli di bottiglia derivanti dai conflitti di risorse tra simulazione e deep learning
- Introduce il Plane Decoupling per isolare i dati di training e il controllo dei pesi
- Utilizza una pipeline asincrona Swimlane a quattro thread
- Pubblicato come arXiv:2605.13276
- Si concentra su modelli foundation embodied su larga scala
- Punta ad alta concorrenza e bassa latenza
- Target: applicazioni di IA Embodied
Entità
Istituzioni
- arXiv