Framework RL Resiliente ai Ritardi per la Teleoperazione Stabile di Robot

other · 2026-05-18

Uno studio pubblicato su arXiv (2605.15480) presenta una nuova strategia di controllo ibrida nota come RL resiliente ai ritardi, volta a mitigare i ritardi di comunicazione stocastici nella teleoperazione. Tali ritardi causano interruzioni nei segnali che compromettono la stabilità del controllo, e le tecniche tradizionali di reinforcement learning spesso falliscono con input ritardati, provocando un eccessivo chatter. Il framework introdotto combina uno stimatore di stato basato su Long Short-Term Memory (LSTM) con una politica RL residua. Questo LSTM genera stime di stato fluide e continue a partire da dati ritardati, consentendo all'agente RL di sviluppare una politica di compensazione della coppia che ottimizza sia la precisione di inseguimento che la fluidità della velocità. I test condotti su robot Franka Panda dimostrano che questo metodo supera significativamente i principali baselines, fornendo una teleoperazione stabile e affidabile anche in scenari con ritardi elevati.

Fatti principali

L'articolo arXiv 2605.15480 propone RL resiliente ai ritardi per la teleoperazione
I ritardi stocastici causano discontinuità del segnale e chatter
Il framework utilizza LSTM per la stima dello stato e una politica RL residua
L'LSTM ricostruisce stime di stato fluide da osservazioni ritardate
La politica residua bilancia accuratezza di inseguimento e fluidità della velocità
Testato su robot Franka Panda
Supera i baselines all'avanguardia
Garantisce teleoperazione robusta sotto ritardi elevati

Framework RL Resiliente ai Ritardi per la Teleoperazione Stabile di Robot

Fatti principali

Entità

Istituzioni

Fonti