Framework DRL a Doppio Agente per la Copertura Robusta di Strutture Sotto Interdizione

other · 2026-05-27

Un nuovo articolo su arXiv propone un framework di Deep Reinforcement Learning a Doppio Agente (DADRL) per risolvere il Problema di Localizzazione-Copertura Massimale con Interdizione (MCLIP), un classico problema di ottimizzazione bi-livello nella pianificazione di infrastrutture resilienti. Il MCLIP coinvolge un livello superiore che seleziona le posizioni delle strutture per massimizzare la copertura, e un livello inferiore che esegue l'interdizione nel caso peggiore per minimizzare tale copertura. Il forte accoppiamento e l'elevata complessità combinatoria di entrambi i livelli rendono inefficaci i metodi tradizionali. Il framework DADRL utilizza l'apprendimento avversario con due agenti: un agente di localizzazione (livello superiore) e un agente di interdizione (livello inferiore). L'agente di localizzazione viene addestrato contro un agente di interdizione in evoluzione, permettendogli di catturare l'interazione competitiva dinamica. L'articolo rivendica tre contributi, incluso questo approccio di addestramento avversario. Il lavoro è rilevante per settori come i servizi di emergenza, le catene di approvvigionamento e le telecomunicazioni, dove le strutture devono rimanere operative sotto attacco.

Fatti principali

Il Problema di Localizzazione-Copertura Massimale con Interdizione (MCLIP) è un classico problema di ottimizzazione bi-livello.
MCLIP è fondamentale per la pianificazione di infrastrutture resilienti.
MCLIP rimane computazionalmente intrattabile.
Il livello superiore determina le posizioni delle strutture per massimizzare la copertura.
Il livello inferiore esegue l'interdizione nel caso peggiore per minimizzare la copertura.
Il framework proposto si chiama Deep Reinforcement Learning a Doppio Agente (DADRL).
DADRL si basa sull'apprendimento avversario.
L'agente di localizzazione corrisponde al livello superiore.
L'agente di interdizione corrisponde al livello inferiore.
L'agente di localizzazione viene addestrato contro un agente di interdizione in evoluzione.

Framework DRL a Doppio Agente per la Copertura Robusta di Strutture Sotto Interdizione

Fatti principali

Entità

Istituzioni

Fonti