DRL ottimizza la cache codificata con vincoli di scadenza
Un nuovo approccio di deep reinforcement learning (DRL) affronta la cache codificata con vincoli di scadenza, dove un server unisce messaggi per servire più utenti simultaneamente tramite multicast codificato. Il problema è critico per applicazioni sensibili al ritardo come lo streaming video, poiché le decisioni di unione influenzano sia le trasmissioni correnti che quelle future. La soluzione proposta formula la consegna come un problema di controllo dello stato della coda con azioni discrete mascherate e addestra una rete di policy con attenzione ai grafi utilizzando l'ottimizzazione della policy prossimale. Questa rete di policy riduce il rapporto di scadenza dei pacchetti broadcast del 40,9% (0,208 contro 0,352) rispetto ai metodi di base. Il lavoro è dettagliato in arXiv:2605.15236.
Fatti principali
- La cache codificata consente di servire più utenti con un singolo messaggio multicast codificato.
- Le applicazioni sensibili al ritardo come lo streaming video richiedono decisioni di unione online sotto scadenze rigorose.
- L'unione può essere dannosa per i messaggi successivi anche se utile per quello corrente.
- Il problema è formulato come un problema di controllo dello stato della coda con azioni discrete mascherate.
- Una rete di policy con attenzione ai grafi viene addestrata tramite ottimizzazione della policy prossimale.
- La rete di policy riduce il rapporto di scadenza dei pacchetti broadcast del 40,9%.
- Il rapporto di scadenza è migliorato da 0,352 a 0,208.
- La ricerca è pubblicata su arXiv con ID 2605.15236.
Entità
Istituzioni
- arXiv