Modello RL Interpretabile Eguaglia le Reti Neurali su Atari Breakout
I ricercatori hanno introdotto un modello di apprendimento esperienziale interpretabile che utilizza la cronologia degli stati e il feedback globale per apprendere modelli comportamentali rappresentati come grafi di transizione tra insiemi di stati, con utilità attribuita e conteggi di evidenza. Progettato per ambienti con risorse limitate, il modello è stato valutato sul benchmark OpenAI Gym Atari Breakout e ha raggiunto prestazioni paragonabili a quelle delle soluzioni basate su reti neurali note. Il lavoro è pubblicato su arXiv nelle categorie di informatica e apprendimento automatico.
Fatti principali
- Il modello utilizza la cronologia degli stati e il feedback globale
- Il modello comportamentale è un grafo di transizione tra insiemi di stati
- Le transizioni sono attribuite con utilità e conteggio di evidenza
- Adatto per l'apprendimento per rinforzo con risorse limitate
- Valutato sul benchmark OpenAI Gym Atari Breakout
- Prestazioni paragonabili a quelle delle soluzioni basate su reti neurali
- Pubblicato su arXiv sotto cs.LG
- ID arXiv: 2605.00940
Entità
Istituzioni
- arXiv
- OpenAI Gym