Apprendimento WA* Auto-Migliorante con Reti Neurali Grafiche Relazionali per la Pianificazione

other · 2026-05-26

Un nuovo articolo su arXiv (2605.25720) propone un framework di apprendimento WA* auto-migliorante combinato con un'euristica di valore basata su Rete Neurale Grafica Relazionale (RGNN) per affrontare la generalizzazione combinatoria nell'Apprendimento per Rinforzo Profondo (DRL). L'approccio utilizza metodi di ricerca best-first come A* per risolvere problemi di pianificazione da zero, senza fare affidamento su dimostrazioni di esperti o cammini casuali. L'euristica guida la ricerca, e i dati di ricerca risultanti aggiornano l'euristica tramite Q-learning, creando un ciclo che produce politiche generali in grado di risolvere nuove istanze. Il lavoro evidenzia la sfida dei domini a ricompensa sparsa dove l'esplorazione standard del RL è inefficace.

Fatti principali

L'articolo arXiv 2605.25720 propone un framework di apprendimento WA* auto-migliorante con RGNN
Affronta la generalizzazione combinatoria nell'Apprendimento per Rinforzo Profondo
Utilizza metodi di ricerca best-first come A* per la pianificazione
L'euristica guida la ricerca, i dati di ricerca aggiornano l'euristica tramite Q-learning
Mira a risolvere nuove istanze senza dimostrazioni di esperti o cammini casuali
Si concentra su domini a ricompensa sparsa nella pianificazione
La Rete Neurale Grafica Relazionale rappresenta l'euristica di valore
Pubblicato su arXiv con tipo di annuncio nuovo

Apprendimento WA* Auto-Migliorante con Reti Neurali Grafiche Relazionali per la Pianificazione

Fatti principali

Entità

Istituzioni

Fonti