Apprendimento WA* Auto-Migliorante con Reti Neurali Grafiche Relazionali per la Pianificazione
Un nuovo articolo su arXiv (2605.25720) propone un framework di apprendimento WA* auto-migliorante combinato con un'euristica di valore basata su Rete Neurale Grafica Relazionale (RGNN) per affrontare la generalizzazione combinatoria nell'Apprendimento per Rinforzo Profondo (DRL). L'approccio utilizza metodi di ricerca best-first come A* per risolvere problemi di pianificazione da zero, senza fare affidamento su dimostrazioni di esperti o cammini casuali. L'euristica guida la ricerca, e i dati di ricerca risultanti aggiornano l'euristica tramite Q-learning, creando un ciclo che produce politiche generali in grado di risolvere nuove istanze. Il lavoro evidenzia la sfida dei domini a ricompensa sparsa dove l'esplorazione standard del RL è inefficace.
Fatti principali
- L'articolo arXiv 2605.25720 propone un framework di apprendimento WA* auto-migliorante con RGNN
- Affronta la generalizzazione combinatoria nell'Apprendimento per Rinforzo Profondo
- Utilizza metodi di ricerca best-first come A* per la pianificazione
- L'euristica guida la ricerca, i dati di ricerca aggiornano l'euristica tramite Q-learning
- Mira a risolvere nuove istanze senza dimostrazioni di esperti o cammini casuali
- Si concentra su domini a ricompensa sparsa nella pianificazione
- La Rete Neurale Grafica Relazionale rappresenta l'euristica di valore
- Pubblicato su arXiv con tipo di annuncio nuovo
Entità
Istituzioni
- arXiv