Pianificazione di Percorsi Ingannevoli contro Osservatori Apprendibili
I ricercatori introducono la Pianificazione di Percorsi Ingannevoli Ripetuta (RDPP), una nuova formulazione che affronta la limitazione dei metodi esistenti di pianificazione di percorsi ingannevoli (DPP) che assumono osservatori statici e non apprendenti. In scenari reali come il trasporto di beni critici o le operazioni militari, gli avversari possono adattarsi apprendendo dalle traiettorie storiche. Lo studio mostra che gli attuali metodi DPP falliscono sotto osservatori apprendibili poiché non riescono ad adattarsi a previsioni in evoluzione. Gli aggiornamenti incrementali causano un ritardo cumulativo, degradando l'inganno. Per risolvere questo problema, gli autori propongono la Meta Pianificazione Ingannevole (DeMP), un framework di ottimizzazione a due livelli che combina l'adattamento a livello di episodio per la regolazione delle politiche a breve termine contro osservatori aggiornati.
Fatti principali
- I metodi DPP esistenti assumono osservatori statici e non apprendenti.
- RDPP modella esplicitamente osservatori apprendibili.
- Gli attuali metodi DPP falliscono sotto osservatori apprendibili.
- Gli aggiornamenti incrementali causano un ritardo cumulativo.
- DeMP è un framework di ottimizzazione a due livelli.
- DeMP combina l'adattamento a livello di episodio.
- Le aree di applicazione includono il trasporto di beni critici e le operazioni militari.
Entità
—