SkillOS: Apprendimento per Rinforzo per Agenti AI Auto-Evolventi

ai-technology · 2026-05-09

I ricercatori propongono SkillOS, un framework di apprendimento per rinforzo che consente agli agenti basati su LLM di curare autonomamente abilità riutilizzabili dalle interazioni passate. Gli agenti attuali non imparano dall'esperienza, basandosi su curation manuale o euristica. SkillOS abbina un esecutore congelato a un curatore addestrabile che aggiorna un SkillRepo esterno utilizzando ricompense composite da feedback ritardato. L'approccio affronta le politiche di curation delle abilità a lungo termine, un collo di bottiglia chiave negli agenti auto-evolventi. L'articolo è disponibile su arXiv con ID 2605.06614.

Fatti principali

SkillOS è una ricetta di addestramento RL per apprendere la curation delle abilità in agenti auto-evolventi.
Abbina un esecutore agente congelato a un curatore di abilità addestrabile.
Il curatore aggiorna un SkillRepo esterno dall'esperienza accumulata.
Ricompense composite forniscono segnali di apprendimento per la curation.
Gli approcci esistenti si basano su curation manuale o operazioni euristiche.
SkillOS affronta politiche di curation complesse a lungo termine da feedback indiretto.
L'articolo è pubblicato su arXiv con ID 2605.06614.
Gli agenti basati su LLM attualmente non imparano dalle interazioni passate.

SkillOS: Apprendimento per Rinforzo per Agenti AI Auto-Evolventi

Fatti principali

Entità

Istituzioni

Fonti