GPG-HT: Politica di Segnale di Grafo Sensibile alla Storia per Routing Affidabile
È stato proposto un nuovo framework chiamato GPG-HT (Generalized Policy Gradient with History-Aware Decision Transformer) per la pianificazione affidabile di percorsi in reti di trasporto stocastiche. Il metodo supera le limitazioni degli approcci esistenti di arrivo puntuale stocastico (SOTA), che si basano solo sul nodo corrente e sul budget rimanente, incorporando osservazioni storiche nodo-arco-tempo. GPG-HT utilizza un Decision Transformer combinato con l'ottimizzazione del gradiente di policy generalizzato per catturare dipendenze spazio-temporali non markoviane e correlazioni dipendenti dalla storia nei tempi di viaggio. Ciò consente un processo decisionale sensibile al contesto per il routing su segnali di grafo, migliorando l'affidabilità in condizioni di incertezza.
Fatti principali
- GPG-HT sta per Generalized Policy Gradient with History-Aware Decision Transformer.
- Il metodo è progettato per il routing affidabile su segnali di grafo.
- Affronta reti di trasporto stocastiche con tempi di viaggio incerti e correlati.
- I metodi SOTA esistenti dipendono solo dal nodo corrente e dal budget rimanente.
- GPG-HT considera osservazioni storiche nodo-arco-tempo.
- Cattura dipendenze spazio-temporali non markoviane.
- Il framework integra un Decision Transformer con l'ottimizzazione del gradiente di policy generalizzato.
- Il lavoro è pubblicato su arXiv con ID 2508.17218.
Entità
Istituzioni
- arXiv