LANTERN: Framework di Apprendimento per Trasferimento Neurosimbiotico Potenziato da LLM
È stato introdotto un nuovo framework di apprendimento per rinforzo chiamato LANTERN (LLM-Augmented Neurosymbolic Transfer with Experience-Gated Reasoning Networks) per migliorare l'apprendimento per trasferimento tra vari compiti sorgente. Questo framework supera le limitazioni degli attuali approcci neurosimbiotici utilizzando grandi modelli linguistici per creare automi deterministici a stati finiti a partire da descrizioni di compiti in linguaggio naturale. Ciò consente l'aggregazione di più politiche sorgente basate su embedding semantico e similarità tra compiti. Inoltre, presenta un gating adattivo insegnante-studente basato sull'errore di differenza temporale e sull'incertezza semantica. Nei test condotti in aree di gestione delle risorse, navigazione e controllo, LANTERN ha dimostrato un aumento del 40-60% nell'efficienza del campionamento rispetto ai metodi di base. La ricerca è disponibile su arXiv con l'identificatore 2605.05478.
Fatti principali
- LANTERN utilizza LLM per generare automi dal linguaggio naturale
- Aggrega più politiche sorgente tramite embedding semantici
- Gating adattivo basato su errore TD e incertezza semantica
- Miglioramenti del 40-60% nell'efficienza del campionamento nei domini testati
- Pubblicato su arXiv: 2605.05478
- Domini: gestione delle risorse, navigazione, controllo
Entità
Istituzioni
- arXiv