Algoritmo PPO con Backbone Condiviso Migliora la Copertura di Comunicazione Multi-UAV

ai-technology · 2026-05-20

I ricercatori propongono un algoritmo Proximal Policy Optimization (PPO) con backbone condiviso per compiti di copertura di comunicazione multi-UAV. L'algoritmo condivide il modulo di base tra le reti Actor e Critic, consentendo un addestramento efficiente e prestazioni migliori rispetto al PPO standard. Un modulo di aggregazione delle informazioni di grafo è integrato per gestire le condizioni di comunicazione tra gli agenti, favorendo una maggiore cooperazione nello sciame. Il metodo è testato in uno scenario di sciame multi-UAV che preserva la connettività, dimostrando risultati superiori.

Fatti principali

Algoritmo PPO con backbone condiviso proposto per la copertura di comunicazione multi-UAV.
Modulo di base condiviso tra le reti Actor e Critic per un addestramento efficiente.
L'algoritmo è confrontato con il PPO standard, ottenendo prestazioni superiori.
Modulo di aggregazione delle informazioni di grafo incorporato per la comunicazione tra agenti.
Lo sciame di agenti addestrato mostra un livello più elevato di cooperazione.
Il compito riguarda la copertura di comunicazione di sciame multi-UAV che preserva la connettività.

Algoritmo PPO con Backbone Condiviso Migliora la Copertura di Comunicazione Multi-UAV

Fatti principali

Entità

Istituzioni

Fonti