Doppio Apprendimento per Rinforzo Profondo per la Selezione di Modelli di Previsione della Domanda
Un nuovo articolo di ricerca propone un agente di doppio apprendimento per rinforzo profondo per automatizzare la selezione di modelli previsionali per la previsione della domanda nella supply chain. L'architettura sceglie un modello da un comitato di previsione al momento della previsione, affrontando la complessità di selezionare soluzioni appropriate per dataset con caratteristiche distinte. Viene introdotto un nuovo approccio di arresto anticipato basato sulla convergenza della ricompensa media per ridurre i tempi di addestramento. Il modello è stato valutato utilizzando dataset di vendite di generi alimentari e domanda di snack. Lo studio si basa su decenni di ricerca sulla selezione automatica di modelli previsionali, sfruttando i recenti progressi nella previsione della domanda.
Fatti principali
- La ricerca propone un agente di doppio apprendimento per rinforzo profondo per la selezione automatica di modelli previsionali.
- L'agente seleziona un modello da un comitato di previsione al momento della previsione.
- Un nuovo approccio di arresto anticipato basato sulla convergenza della ricompensa media accelera l'addestramento.
- La valutazione empirica ha utilizzato dataset di vendite di generi alimentari e domanda di snack.
- Il lavoro affronta la sfida di selezionare soluzioni previsionali appropriate per dataset con caratteristiche distinte.
- La ricerca sulla selezione automatica di modelli previsionali è in corso dagli anni '80.
- I recenti sviluppi nella previsione della domanda hanno aperto nuove prospettive.
- Lo studio è pubblicato su arXiv con ID 2605.04068.
Entità
Istituzioni
- arXiv