Pianificazione di Percorsi Ingannevoli contro Osservatori Apprendibili

ai-technology · 2026-05-11

I ricercatori introducono la Pianificazione di Percorsi Ingannevoli Ripetuta (RDPP), una nuova formulazione che affronta la limitazione dei metodi esistenti di pianificazione di percorsi ingannevoli (DPP) che assumono osservatori statici e non apprendenti. In scenari reali come il trasporto di beni critici o le operazioni militari, gli avversari possono adattarsi apprendendo dalle traiettorie storiche. Lo studio mostra che gli attuali metodi DPP falliscono sotto osservatori apprendibili poiché non riescono ad adattarsi a previsioni in evoluzione. Gli aggiornamenti incrementali causano un ritardo cumulativo, degradando l'inganno. Per risolvere questo problema, gli autori propongono la Meta Pianificazione Ingannevole (DeMP), un framework di ottimizzazione a due livelli che combina l'adattamento a livello di episodio per la regolazione delle politiche a breve termine contro osservatori aggiornati.

Fatti principali

I metodi DPP esistenti assumono osservatori statici e non apprendenti.
RDPP modella esplicitamente osservatori apprendibili.
Gli attuali metodi DPP falliscono sotto osservatori apprendibili.
Gli aggiornamenti incrementali causano un ritardo cumulativo.
DeMP è un framework di ottimizzazione a due livelli.
DeMP combina l'adattamento a livello di episodio.
Le aree di applicazione includono il trasporto di beni critici e le operazioni militari.

Entità

—

Fonti

arXiv cs.AI — 2026-05-11