I POMDP Posterior-Deterministici Consentono l'Approssimazione della Raggiungibilità
I ricercatori hanno introdotto i processi decisionali di Markov parzialmente osservabili posterior-deterministici (POMDP), una nuova classe di modelli che supera una limitazione fondamentale dei POMDP standard. Mentre il risultato seminale di Madani et al. (2003) ha dimostrato che calcolare o approssimare la probabilità massima di raggiungibilità nei POMDP generali è impossibile, la nuova classe consente l'approssimazione con precisione arbitraria. Ciò contrasta con gli MDP completamente osservabili, dove la raggiungibilità è risolvibile in tempo polinomiale. Il lavoro si concentra sul contributo teorico di definire i POMDP posterior-deterministici e dimostrarne l'approssimabilità, con implicazioni per la verifica e la sintesi in condizioni di incertezza.
Fatti principali
- I POMDP posterior-deterministici sono una nuova classe di POMDP.
- La probabilità massima di raggiungibilità può essere approssimata con precisione arbitraria per questa classe.
- Madani et al. (2003) hanno dimostrato che la raggiungibilità nei POMDP generali non è approssimabile.
- Gli MDP completamente osservabili consentono il calcolo della raggiungibilità in tempo polinomiale.
- Il lavoro affronta problemi di verifica e sintesi per i POMDP.
- I POMDP sono un modello fondamentale per il processo decisionale sequenziale in condizioni di incertezza.
Entità
—