Forager: Un Ambiente Leggero per Apprendimento Continuo con RL

other · 2026-05-06

Forager è un ambiente leggero, parzialmente osservabile, per l'apprendimento continuo con rinforzo (CRL), introdotto nell'articolo arXiv 2605.01131. Colma una lacuna nella ricerca CRL, dove la maggior parte degli esperimenti si concentra sulla perdita di plasticità in MDP completamente osservabili con non-stazionarietà aggiunta, ignorando la parzialmente osservabilità e gli agenti basati su memoria. Forager mantiene un'impronta di memoria costante, rendendolo accessibile per esperimenti ripetuti. L'articolo fornisce compiti di esempio che dimostrano come Forager metta alla prova gli attuali agenti CRL, consentendo al contempo ulteriori ricerche.

Fatti principali

Forager è un ambiente CRL parzialmente osservabile
Ha un'impronta di memoria costante
Progettato per testare l'apprendimento continuo con osservabilità parziale
La maggior parte degli esperimenti CRL ignora l'osservabilità parziale
Forager è leggero e adatto per esperimenti ripetuti
I compiti di esempio mostrano che sfida gli attuali agenti CRL
Articolo disponibile su arXiv: 2605.01131
Tipo di annuncio: cross

Forager: Un Ambiente Leggero per Apprendimento Continuo con RL

Fatti principali

Entità

Istituzioni

Fonti