QuickLAP: un framework bayesiano fonde feedback fisico e linguistico per l'apprendimento robotico
I ricercatori hanno presentato QuickLAP (Quick Language-Action Preference learning), un framework bayesiano progettato per unire correzioni fisiche e feedback in linguaggio naturale per l'inferenza in tempo reale della funzione di ricompensa in sistemi semi-autonomi. Il concetto innovativo considera il linguaggio come un'osservazione probabilistica delle preferenze latenti dell'utente, che aiuta a identificare caratteristiche significative della ricompensa e interpretare correttamente le correzioni fisiche. QuickLAP sfrutta i modelli linguistici di grandi dimensioni (LLM) per derivare maschere di attenzione delle caratteristiche della ricompensa e spostamenti di preferenza da dichiarazioni informali, combinando queste intuizioni con il feedback fisico attraverso una regola di aggiornamento in forma chiusa. Ciò facilita un apprendimento rapido, in tempo reale e affidabile della ricompensa, in grado di gestire feedback ambigui. Il framework è stato valutato in un simulatore di guida semi-autonomo, dimostrando la sua efficacia. Risolve i limiti di ciascuna modalità: le correzioni fisiche, sebbene fondate, possono essere poco chiare nell'intento, mentre il linguaggio articola obiettivi di alto livello ma manca di contesto fisico.
Fatti principali
- QuickLAP fonde feedback fisico e linguistico per inferire funzioni di ricompensa in tempo reale.
- Il linguaggio è trattato come un'osservazione probabilistica delle preferenze latenti dell'utente.
- Gli LLM estraggono maschere di attenzione delle caratteristiche della ricompensa e spostamenti di preferenza da espressioni libere.
- Il feedback fisico è integrato tramite una regola di aggiornamento in forma chiusa.
- Testato in un simulatore di guida semi-autonomo.
- Gestisce feedback ambigui in modo robusto.
- Le correzioni fisiche sono fondate ma ambigue nell'intento.
- Il linguaggio esprime obiettivi di alto livello ma manca di fondamento fisico.
Entità
Istituzioni
- arXiv