Astrazioni basate su ASP per l'Apprendimento per Rinforzo
Un nuovo articolo su arXiv (2605.31444) esplora l'uso della Programmazione a Insiemi di Risposta (ASP) per implementare astrazioni per l'Apprendimento per Rinforzo (RL). Il framework CARCASS, originariamente sviluppato da Martijn van Otterlo, utilizza rappresentazioni logiche per modellare Processi Decisionali di Markov (MDP) in domini del primo ordine, precedentemente implementato in Prolog. Questa ricerca sostituisce Prolog con ASP, un linguaggio di modellazione completamente dichiarativo, per creare astrazioni potenti. L'implementazione basata su ASP è stata valutata in due domini: Blocks World e Minigrid. I risultati indicano che CARCASS con ASP offre un approccio promettente per costruire astrazioni in RL, affrontando le sfide di grandi spazi di stati e generalizzazione.
Fatti principali
- L'articolo arXiv:2605.31444 propone astrazioni basate su ASP per RL.
- Il framework CARCASS di Martijn van Otterlo modella MDP in domini del primo ordine.
- Il CARCASS originale usava Prolog; questo lavoro usa ASP.
- ASP è un linguaggio di modellazione completamente dichiarativo.
- Valutazione nei domini Blocks World e Minigrid.
- I risultati mostrano promesse per costruire astrazioni in RL.
- L'astrazione affronta grandi spazi di stati e generalizzazione.
- L'Apprendimento per Rinforzo Relazionale (RRL) ragiona su oggetti e relazioni.
Entità
Artisti
- Martijn van Otterlo