Alice: un sistema per l'apprendimento online di modelli eseguibili del mondo in presenza di disallineamento delle conoscenze pregresse
Un recente preprint su arXiv presenta Alice, un framework a ciclo chiuso progettato per l'apprendimento online di modelli eseguibili del mondo in situazioni in cui le conoscenze pregresse non sono allineate. Il sistema interpreta gli aggiornamenti candidati non riusciti come indicatori strutturali: quando un candidato spiega una nuova transizione ma non riesce a mantenere quelle già spiegate, il conseguente conflitto di conservazione rivela dinamiche precedentemente mescolate dal programma corrente. Alice trasforma questi conflitti in classi di ipotesi che producono controesempi di conservazione compatti e stratificati per classe per gli aggiornamenti, facilitando l'esplorazione verso transizioni nuove e meno rappresentate. Questa ricerca affronta il problema di derivare dinamiche dipendenti dallo stato esclusivamente dai dati di interazione, senza fare affidamento su descrizioni di regole, segnali di ricompensa o prior lessicali affidabili.
Fatti principali
- arXiv:2605.16725v1
- Tipo di annuncio: nuovo
- Alice è un sistema a ciclo chiuso
- Tratta gli aggiornamenti candidati falliti come segnale strutturale
- Il conflitto di conservazione rivela dinamiche mescolate
- Raffina i conflitti in classi di ipotesi
- Fornisce controesempi di conservazione compatti
- Guida l'esplorazione della frontiera verso transizioni nuove
Entità
Istituzioni
- arXiv