Instradamento dei veicoli basato su DRL con miscela di esperti per la generalizzazione
I ricercatori hanno introdotto R2E-IG, un modello volto a generalizzare le soluzioni per i Problemi di Instradamento dei Veicoli (VRP) attraverso l'Apprendimento per Rinforzo Profondo (DRL). Gli attuali approcci DRL, che si basano su distribuzioni uniformi, faticano con le variazioni del mondo reale. R2E-IG migliora la rete di policy dividendola in diversi moduli, che vengono poi riassemblati adattivamente utilizzando un meccanismo di gating a livello di istanza. Questo design incorpora Esperti Raffinati Residuali (R2E) per migliorare l'espressività tramite raffinamento residuale. Il meccanismo di gating è responsabile dell'apprendimento di rappresentazioni consapevoli della distribuzione, indirizzando gli input ai moduli appropriati. Questo articolo, che enfatizza la generalizzazione cross-distribuzione, è disponibile su arXiv (2605.26776).
Fatti principali
- L'articolo arXiv 2605.26776 propone R2E-IG per la generalizzazione dei VRP
- R2E-IG utilizza un approccio a miscela di esperti con gating a livello di istanza
- Gli Esperti Raffinati Residuali (R2E) migliorano l'espressività tramite raffinamento residuale
- Il gating a livello di istanza apprende rappresentazioni consapevoli della distribuzione
- I metodi DRL esistenti addestrati su distribuzioni uniformi falliscono sotto cambiamenti di distribuzione
- Il modello ricombina adattivamente i moduli durante l'inferenza
- I contributi includono l'architettura R2E, il gating a livello di istanza e un approccio a miscela di esperti
- L'articolo è un metodo di generalizzazione cross-distribuzione per i VRP
Entità
Istituzioni
- arXiv