ARTFEED — Contemporary Art Intelligence

MOMO: Un framework multimodale per l'apprendimento e l'adattamento delle abilità robotiche

ai-technology · 2026-04-24

MOMO è un framework interattivo innovativo creato da ricercatori per facilitare l'adattamento delle abilità robotiche attraverso tre modalità chiave: il tocco cinestetico per regolazioni spaziali, il linguaggio naturale per modifiche semantiche e un'interfaccia web grafica che consente agli utenti di visualizzare traiettorie e modificare punti di passaggio con funzionalità di trascinamento. Questo sistema comprende cinque componenti essenziali: rilevamento basato sull'energia delle intenzioni umane, un'architettura LLM basata su strumenti che sceglie e parametrizza funzioni di adattamento linguistico sicure, Primitive di Movimento Kernelizzate (KMP) per codificare il movimento, Vincoli Virtuali probabilistici per dimostrazioni guidate e un'interfaccia web. Rivolto a utenti non esperti, questo framework migliora l'adattabilità dei robot industriali per diversi compiti e ambienti, promuovendo un'interazione flessibile uomo-robot. L'articolo è accessibile su arXiv con ID 2604.20468.

Fatti principali

  • MOMO consente l'adattamento delle abilità robotiche tramite tocco cinestetico, linguaggio naturale e un'interfaccia web grafica.
  • Il framework utilizza un'architettura LLM basata su strumenti che seleziona e parametrizza funzioni predefinite.
  • Integra rilevamento delle intenzioni umane basato sull'energia, KMP e Vincoli Virtuali probabilistici.
  • Il sistema è rivolto a utenti non esperti per applicazioni flessibili di robot industriali.
  • L'articolo è stato pubblicato su arXiv con ID 2604.20468.
  • L'approccio mira a consentire un facile adattamento per compiti e ambienti variabili.
  • L'interfaccia web supporta la visualizzazione di relazioni geometriche e traiettorie.
  • Il linguaggio naturale viene utilizzato per modifiche semantiche di alto livello.

Entità

Istituzioni

  • arXiv

Fonti