Instradamento dei veicoli basato su DRL con miscela di esperti per la generalizzazione

ai-technology · 2026-05-27

I ricercatori hanno introdotto R2E-IG, un modello volto a generalizzare le soluzioni per i Problemi di Instradamento dei Veicoli (VRP) attraverso l'Apprendimento per Rinforzo Profondo (DRL). Gli attuali approcci DRL, che si basano su distribuzioni uniformi, faticano con le variazioni del mondo reale. R2E-IG migliora la rete di policy dividendola in diversi moduli, che vengono poi riassemblati adattivamente utilizzando un meccanismo di gating a livello di istanza. Questo design incorpora Esperti Raffinati Residuali (R2E) per migliorare l'espressività tramite raffinamento residuale. Il meccanismo di gating è responsabile dell'apprendimento di rappresentazioni consapevoli della distribuzione, indirizzando gli input ai moduli appropriati. Questo articolo, che enfatizza la generalizzazione cross-distribuzione, è disponibile su arXiv (2605.26776).

Fatti principali

L'articolo arXiv 2605.26776 propone R2E-IG per la generalizzazione dei VRP
R2E-IG utilizza un approccio a miscela di esperti con gating a livello di istanza
Gli Esperti Raffinati Residuali (R2E) migliorano l'espressività tramite raffinamento residuale
Il gating a livello di istanza apprende rappresentazioni consapevoli della distribuzione
I metodi DRL esistenti addestrati su distribuzioni uniformi falliscono sotto cambiamenti di distribuzione
Il modello ricombina adattivamente i moduli durante l'inferenza
I contributi includono l'architettura R2E, il gating a livello di istanza e un approccio a miscela di esperti
L'articolo è un metodo di generalizzazione cross-distribuzione per i VRP

Instradamento dei veicoli basato su DRL con miscela di esperti per la generalizzazione

Fatti principali

Entità

Istituzioni

Fonti