Algoritmo PPO con Backbone Condiviso Migliora la Copertura di Comunicazione Multi-UAV
I ricercatori propongono un algoritmo Proximal Policy Optimization (PPO) con backbone condiviso per compiti di copertura di comunicazione multi-UAV. L'algoritmo condivide il modulo di base tra le reti Actor e Critic, consentendo un addestramento efficiente e prestazioni migliori rispetto al PPO standard. Un modulo di aggregazione delle informazioni di grafo è integrato per gestire le condizioni di comunicazione tra gli agenti, favorendo una maggiore cooperazione nello sciame. Il metodo è testato in uno scenario di sciame multi-UAV che preserva la connettività, dimostrando risultati superiori.
Fatti principali
- Algoritmo PPO con backbone condiviso proposto per la copertura di comunicazione multi-UAV.
- Modulo di base condiviso tra le reti Actor e Critic per un addestramento efficiente.
- L'algoritmo è confrontato con il PPO standard, ottenendo prestazioni superiori.
- Modulo di aggregazione delle informazioni di grafo incorporato per la comunicazione tra agenti.
- Lo sciame di agenti addestrato mostra un livello più elevato di cooperazione.
- Il compito riguarda la copertura di comunicazione di sciame multi-UAV che preserva la connettività.
Entità
Istituzioni
- arXiv