ARTFEED — Contemporary Art Intelligence

MOCI: Inferenza di Vincoli Multi-Obiettivo per l'Apprendimento per Rinforzo

other · 2026-05-11

Un nuovo framework, Multi-Objective Constraint Inference (MOCI), estrae congiuntamente vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti nell'apprendimento per rinforzo. A differenza degli approcci esistenti che assumono dimostrazioni omogenee da un singolo esperto o da più esperti con obiettivi identici, MOCI modella comportamenti diversi e potenzialmente conflittuali. Le valutazioni empiriche mostrano che MOCI supera significativamente le baseline in termini di prestazioni predittive ed efficienza computazionale.

Fatti principali

  • 1. MOCI è un nuovo framework per l'inferenza di vincoli nell'apprendimento per rinforzo.
  • 2. Estrae vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti.
  • 3. Gli approcci esistenti assumono dimostrazioni omogenee.
  • 4. MOCI gestisce più esperti con obiettivi diversi.
  • 5. Le valutazioni empiriche mostrano che MOCI supera le baseline esistenti.
  • 6. MOCI raggiunge prestazioni predittive migliorate.
  • 7. MOCI mantiene l'efficienza computazionale.
  • 8. L'articolo è disponibile su arXiv con ID 2605.06951.

Entità

Istituzioni

  • arXiv

Fonti