Schermatura POMDP a Intervalli per Sistemi Autonomi Sicuri
Un nuovo articolo su arXiv propone un metodo per garantire la sicurezza in sistemi autonomi con percezione imperfetta. L'approccio utilizza processi decisionali di Markov parzialmente osservabili a intervalli (POMDP) per modellare l'incertezza percettiva a partire da dati etichettati finiti. Viene costruito uno schermo runtime che fornisce garanzie di sicurezza a orizzonte finito con alta probabilità, assumendo che i veri tassi di percezione rientrino negli intervalli di confidenza appresi.
Fatti principali
- Articolo arXiv 2604.20728
- Schermatura POMDP a intervalli per agenti con percezione imperfetta
- Dinamiche del sistema note, ma incertezza percettiva stimata da dati finiti
- Intervalli di confidenza costruiti per le probabilità degli esiti percettivi
- Insieme di credenze conservative calcolato coerente con le osservazioni
- Garanzia di sicurezza a orizzonte finito con alta probabilità sui dati di addestramento
- Lo schermo blocca azioni che potrebbero violare la sicurezza
- Si assume che i veri tassi di incertezza percettiva rientrino negli intervalli appresi
Entità
Istituzioni
- arXiv