ASH: Un Agente AI Impara Compiti Embodied da Video Internet
I ricercatori hanno introdotto un innovativo sistema di IA chiamato ASH (Agents that Self-Hone), in grado di apprendere compiti complessi e di lunga durata da video online non etichettati, senza bisogno di input esperti o modellazione delle ricompense. Questo sistema ha una funzione di auto-miglioramento che gli permette di creare un Modello Dinamico Inverso (IDM) dalle proprie esperienze, che utilizza per ottenere informazioni da clip Internet pertinenti. Impiega inoltre l'apprendimento non supervisionato per identificare eventi chiave in vaste librerie video, memorizzandoli come ricordi a lungo termine per una pianificazione complessa. ASH è stato valutato in scenari di gioco impegnativi, in particolare Pokémon Smeraldo e The Legend of Zelda: The Minish Cap, superando metodi tradizionali come il clonaggio comportamentale e gli approcci zero-shot. La ricerca è disponibile su arXiv con l'identificatore 2605.14211.
Fatti principali
- ASH sta per Agents that Self-Hone via Embodied Learning.
- ASH apprende da video Internet non etichettati e rumorosi senza modellazione delle ricompense o annotazioni esperte.
- ASH utilizza un ciclo di auto-miglioramento che apprende un Modello Dinamico Inverso (IDM) dalle proprie traiettorie.
- ASH impiega l'apprendimento non supervisionato per identificare momenti chiave da video Internet e li memorizza come memoria a lungo termine.
- ASH è stato valutato su Pokémon Smeraldo e The Legend of Zelda: The Minish Cap.
- Pokémon Smeraldo è un RPG a turni; The Legend of Zelda: The Minish Cap è un gioco d'azione-avventura in tempo reale.
- ASH ha superato il clonaggio comportamentale, i metodi retrieval-augmented e gli approcci zero-shot.
- La ricerca è pubblicata su arXiv con ID 2605.14211.
Entità
Istituzioni
- arXiv