Framework RL Resiliente ai Ritardi per la Teleoperazione Stabile di Robot
Uno studio pubblicato su arXiv (2605.15480) presenta una nuova strategia di controllo ibrida nota come RL resiliente ai ritardi, volta a mitigare i ritardi di comunicazione stocastici nella teleoperazione. Tali ritardi causano interruzioni nei segnali che compromettono la stabilità del controllo, e le tecniche tradizionali di reinforcement learning spesso falliscono con input ritardati, provocando un eccessivo chatter. Il framework introdotto combina uno stimatore di stato basato su Long Short-Term Memory (LSTM) con una politica RL residua. Questo LSTM genera stime di stato fluide e continue a partire da dati ritardati, consentendo all'agente RL di sviluppare una politica di compensazione della coppia che ottimizza sia la precisione di inseguimento che la fluidità della velocità. I test condotti su robot Franka Panda dimostrano che questo metodo supera significativamente i principali baselines, fornendo una teleoperazione stabile e affidabile anche in scenari con ritardi elevati.
Fatti principali
- L'articolo arXiv 2605.15480 propone RL resiliente ai ritardi per la teleoperazione
- I ritardi stocastici causano discontinuità del segnale e chatter
- Il framework utilizza LSTM per la stima dello stato e una politica RL residua
- L'LSTM ricostruisce stime di stato fluide da osservazioni ritardate
- La politica residua bilancia accuratezza di inseguimento e fluidità della velocità
- Testato su robot Franka Panda
- Supera i baselines all'avanguardia
- Garantisce teleoperazione robusta sotto ritardi elevati
Entità
Istituzioni
- arXiv