MOMO: Un framework multimodale per l'apprendimento e l'adattamento delle abilità robotiche
MOMO è un framework interattivo innovativo creato da ricercatori per facilitare l'adattamento delle abilità robotiche attraverso tre modalità chiave: il tocco cinestetico per regolazioni spaziali, il linguaggio naturale per modifiche semantiche e un'interfaccia web grafica che consente agli utenti di visualizzare traiettorie e modificare punti di passaggio con funzionalità di trascinamento. Questo sistema comprende cinque componenti essenziali: rilevamento basato sull'energia delle intenzioni umane, un'architettura LLM basata su strumenti che sceglie e parametrizza funzioni di adattamento linguistico sicure, Primitive di Movimento Kernelizzate (KMP) per codificare il movimento, Vincoli Virtuali probabilistici per dimostrazioni guidate e un'interfaccia web. Rivolto a utenti non esperti, questo framework migliora l'adattabilità dei robot industriali per diversi compiti e ambienti, promuovendo un'interazione flessibile uomo-robot. L'articolo è accessibile su arXiv con ID 2604.20468.
Fatti principali
- MOMO consente l'adattamento delle abilità robotiche tramite tocco cinestetico, linguaggio naturale e un'interfaccia web grafica.
- Il framework utilizza un'architettura LLM basata su strumenti che seleziona e parametrizza funzioni predefinite.
- Integra rilevamento delle intenzioni umane basato sull'energia, KMP e Vincoli Virtuali probabilistici.
- Il sistema è rivolto a utenti non esperti per applicazioni flessibili di robot industriali.
- L'articolo è stato pubblicato su arXiv con ID 2604.20468.
- L'approccio mira a consentire un facile adattamento per compiti e ambienti variabili.
- L'interfaccia web supporta la visualizzazione di relazioni geometriche e traiettorie.
- Il linguaggio naturale viene utilizzato per modifiche semantiche di alto livello.
Entità
Istituzioni
- arXiv