ARTFEED — Contemporary Art Intelligence

Forager: Un Ambiente Leggero per Apprendimento Continuo con RL

other · 2026-05-06

Forager è un ambiente leggero, parzialmente osservabile, per l'apprendimento continuo con rinforzo (CRL), introdotto nell'articolo arXiv 2605.01131. Colma una lacuna nella ricerca CRL, dove la maggior parte degli esperimenti si concentra sulla perdita di plasticità in MDP completamente osservabili con non-stazionarietà aggiunta, ignorando la parzialmente osservabilità e gli agenti basati su memoria. Forager mantiene un'impronta di memoria costante, rendendolo accessibile per esperimenti ripetuti. L'articolo fornisce compiti di esempio che dimostrano come Forager metta alla prova gli attuali agenti CRL, consentendo al contempo ulteriori ricerche.

Fatti principali

  • Forager è un ambiente CRL parzialmente osservabile
  • Ha un'impronta di memoria costante
  • Progettato per testare l'apprendimento continuo con osservabilità parziale
  • La maggior parte degli esperimenti CRL ignora l'osservabilità parziale
  • Forager è leggero e adatto per esperimenti ripetuti
  • I compiti di esempio mostrano che sfida gli attuali agenti CRL
  • Articolo disponibile su arXiv: 2605.01131
  • Tipo di annuncio: cross

Entità

Istituzioni

  • arXiv

Fonti