MOCI: Inferenza di Vincoli Multi-Obiettivo per l'Apprendimento per Rinforzo

other · 2026-05-11

Un nuovo framework, Multi-Objective Constraint Inference (MOCI), estrae congiuntamente vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti nell'apprendimento per rinforzo. A differenza degli approcci esistenti che assumono dimostrazioni omogenee da un singolo esperto o da più esperti con obiettivi identici, MOCI modella comportamenti diversi e potenzialmente conflittuali. Le valutazioni empiriche mostrano che MOCI supera significativamente le baseline in termini di prestazioni predittive ed efficienza computazionale.

Fatti principali

1. MOCI è un nuovo framework per l'inferenza di vincoli nell'apprendimento per rinforzo.
2. Estrae vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti.
3. Gli approcci esistenti assumono dimostrazioni omogenee.
4. MOCI gestisce più esperti con obiettivi diversi.
5. Le valutazioni empiriche mostrano che MOCI supera le baseline esistenti.
6. MOCI raggiunge prestazioni predittive migliorate.
7. MOCI mantiene l'efficienza computazionale.
8. L'articolo è disponibile su arXiv con ID 2605.06951.

MOCI: Inferenza di Vincoli Multi-Obiettivo per l'Apprendimento per Rinforzo

Fatti principali

Entità

Istituzioni

Fonti