L'inferenza cloud eguaglia le prestazioni on-device per il controllo in tempo reale
Un nuovo studio mette in discussione l'assunto che l'inferenza basata su cloud non sia adatta per compiti di controllo sensibili alla latenza nei sistemi cyber-fisici (CPS). La ricerca dimostra che le piattaforme cloud con risorse di calcolo ad alta produttività possono ammortizzare i ritardi di rete e di accodamento, eguagliando o superando le prestazioni on-device per il processo decisionale in tempo reale. Gli autori hanno sviluppato un modello analitico formale che caratterizza i compromessi dell'inferenza distribuita. Il lavoro appare su arXiv con identificatore 2605.00005.
Fatti principali
- Lo studio riconsidera l'assunto che l'inferenza cloud non sia adatta per il controllo sensibile alla latenza.
- Le piattaforme cloud con calcolo ad alta produttività possono eguagliare o superare le prestazioni on-device.
- Un modello analitico formale caratterizza i compromessi dell'inferenza distribuita.
- Articolo disponibile su arXiv: 2605.00005.
Entità
Istituzioni
- arXiv