Modello RL Interpretabile Eguaglia le Reti Neurali su Atari Breakout

ai-technology · 2026-05-06

I ricercatori hanno introdotto un modello di apprendimento esperienziale interpretabile che utilizza la cronologia degli stati e il feedback globale per apprendere modelli comportamentali rappresentati come grafi di transizione tra insiemi di stati, con utilità attribuita e conteggi di evidenza. Progettato per ambienti con risorse limitate, il modello è stato valutato sul benchmark OpenAI Gym Atari Breakout e ha raggiunto prestazioni paragonabili a quelle delle soluzioni basate su reti neurali note. Il lavoro è pubblicato su arXiv nelle categorie di informatica e apprendimento automatico.

Fatti principali

Il modello utilizza la cronologia degli stati e il feedback globale
Il modello comportamentale è un grafo di transizione tra insiemi di stati
Le transizioni sono attribuite con utilità e conteggio di evidenza
Adatto per l'apprendimento per rinforzo con risorse limitate
Valutato sul benchmark OpenAI Gym Atari Breakout
Prestazioni paragonabili a quelle delle soluzioni basate su reti neurali
Pubblicato su arXiv sotto cs.LG
ID arXiv: 2605.00940

Modello RL Interpretabile Eguaglia le Reti Neurali su Atari Breakout

Fatti principali

Entità

Istituzioni

Fonti