Studio sulla Robustezza delle Politiche POMDP alle Perturbazioni delle Osservazioni
Un nuovo articolo su arXiv (2604.21256) introduce il Problema della Robustezza delle Osservazioni delle Politiche per i Processi Decisionali di Markov Parzialmente Osservabili (POMDP). Il lavoro analizza come le deviazioni nel modello di osservazione influenzino le prestazioni della politica, considerando varianti sticky (dipendenti dallo stato-azione) e non sticky (dipendenti dalla storia). Il problema è formulato come un'ottimizzazione a due livelli in cui l'ottimizzazione interna è monotona rispetto all'entità della deviazione.
Fatti principali
- L'articolo introduce il Problema della Robustezza delle Osservazioni delle Politiche per i POMDP
- Studia le deviazioni nel modello di osservazione
- Due varianti: sticky e non sticky
- Formulato come problema di ottimizzazione a due livelli
- L'ottimizzazione interna è monotona rispetto all'entità della deviazione
- Pubblicato su arXiv con ID 2604.21256
- Si concentra sulla robustezza a derive di calibrazione o degrado dei sensori
- Determina la deviazione massima tollerabile per una soglia di valore garantita
Entità
Istituzioni
- arXiv